KR20220113442A - 입자 전달 시스템 - Google Patents
입자 전달 시스템 Download PDFInfo
- Publication number
- KR20220113442A KR20220113442A KR1020227022874A KR20227022874A KR20220113442A KR 20220113442 A KR20220113442 A KR 20220113442A KR 1020227022874 A KR1020227022874 A KR 1020227022874A KR 20227022874 A KR20227022874 A KR 20227022874A KR 20220113442 A KR20220113442 A KR 20220113442A
- Authority
- KR
- South Korea
- Prior art keywords
- xdp
- sequence
- seq
- protein
- nucleic acid
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/111—General methods applicable to biologically active non-coding nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
- C12N15/86—Viral vectors
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/005—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/30—Special therapeutic applications
- C12N2320/32—Special delivery means, e.g. tissue-specific
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16023—Virus like particles [VLP]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16041—Use of virus, viral particle or viral elements as a vector
- C12N2740/16043—Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2740/00—Reverse transcribing RNA viruses
- C12N2740/00011—Details
- C12N2740/10011—Retroviridae
- C12N2740/16011—Human Immunodeficiency Virus, HIV
- C12N2740/16211—Human Immunodeficiency Virus, HIV concerning HIV gagpol
- C12N2740/16222—New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Medicinal Chemistry (AREA)
- Virology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Seeds, Soups, And Other Foods (AREA)
- Medicinal Preparation (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
임의의 유형의 페이로드의 전달에 유용한 전달 입자 시스템(XDP)이 본 명세서에 제공된다. 일부 실시형태에서, 관심 표적 세포에 대한 친화성을 갖는 XDP 입자 시스템은 표적 세포에서 핵산의 변형을 위해 CRISPR/Cas 폴리펩티드(예를 들어, CasX 단백질) 및 가이드 핵산(gNA)을 전달하는 데 사용된다. 또한 이러한 세포에서 핵산을 변형하기 위해 이러한 XDP를 만들고 사용하는 방법이 제공된다.
Description
관련 출원에 대한 교차 참조
본 출원은 2019년 12월 6일에 출원된 미국 가특허 출원 번호 62/944,982, 2020년 1월 31일에 출원된 62/968,915, 2020년 2월 28일에 출원된 62/983,460, 2020년 6월 5일에 출원된 63/035,576 및 2020년 12월 3일에 출원된 63/120,864에 대한 우선권을 주장하며, 그 각각의 내용은 그 전체가 참고로 본 명세서에 포함된다.
서열 목록의 참조에 의한 통합
본 출원은 EFS-WEB를 통해 ASCII 형식으로 제출되었고 그 전체가 참고로 본 명세서에 합체된 서열 목록을 함유한다. 2020년 12월 4일에 생성된 상기 ASCII 사본은 SCRB_024_05WO_SeqList_ST25.txt로 명명되고 크기는 3.14MB이다.
신체의 특정 세포 또는 기관에 단백질 또는 핵산 치료제의 전달은 일반적으로 표적화 양식 또는 비히클이 치료제에 연결되거나 치료제를 함유하는 복잡한 시스템을 요한다. 단일클론 항체와 같은 고도로 선택적인 표적화 방식을 사용하더라도, 표적 세포 또는 기관에 대한 시스템의 선택성은 절대적이지 않고 표적-외 독성이 결과로 나타날 수 있다.
바이러스의 레트로바이러스과 패밀리는 인간 및 기타 포유동물 종에서 긴 잠복기를 특징으로 하는 만성 및 치명적인 질환을 야기하는 여러 바이러스의 속을 포괄한다. 레트로바이러스과 패밀리는 오소레트로바이러스아과(렌티바이러스, 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스) 및 스푸마레트로바이러스아과를 포함한다. 가장 잘 알려진 렌티바이러스는 후천성 면역 결핍 증후군(AIDS)을 유발하는 인간 면역결핍 바이러스(HIV)이다. 모든 레트로바이러스와 마찬가지로 렌티바이러스는 5'-gag-pol-env-3'인 순서로 바이러스 단백질을 코딩하는 gag, pol 및 env 유전자를 갖는다. 렌티바이러스 시스템은 유전자 편집 시스템을 함유하는 바이러스-유사 입자(VLP)의 생성에 의하여 인간 또는 동물 세포 안으로 유전자 편집 시스템을 도입하도록 조정되었다. 레트로바이러스의 시스템은 분열 및 비-분열 세포의 고효율 감염, 이식유전자의 장기간 안정적인 발현, 및 낮은 면역원성을 포함하여, 다른 유전자-요법 방법에 비해 장점이 있다. 렌티바이러스는 PDGF(혈소판-유래 성장 인자)를 인코딩하는 유전자를 갖는 당뇨병 마우스의 형질도입에 성공적으로 사용되었으며, 이 요법은 인간에서의 사용이 고려되고 있다(Lee JA, 등 Lentiviral transfection with the PDGF-B gene improves diabetic wound healing. Plast. Reconstr. Surg. 116 (2): 532 (2005)). 그러나, VLP에서 CRISPR 뉴클레아제와 같은 특정 치료제의 사용에 있어 하나의 주요한 어려움은 특히 플라스미드/바이러스 벡터를 통한 것과 같은 전통적인 발현 방법을 사용할 때 뉴클레아제의 장기간 발현과 함께 표적-외 효과이다. 따라서, 바이러스 벡터로부터 유래된 입자를 사용한 유전자 편집 시스템의 전달을 위한 개선된 시스템에 대한 요구가 남아 있다.
본 개시내용은 단백질, 핵산, 소분자 등을 포함하는 치료 페이로드를 표적 세포 및 조직으로 전달하기 위한 전달 입자(XDP) 시스템을 제공한다.
일부 실시형태에서, XDP 시스템은 레트로바이러스 gag 폴리단백질, 치료 페이로드, 및 향성 인자의 전부 또는 일부로부터 선택된 성분을 인코딩하는 핵산을 포함하고, 여기서 향성 인자는 표적 세포 마커에 대한 당단백질, 항체 단편, 수용체 및 리간드로 구성된 군으로부터 선택된다. 전기한 것의 일 실시형태에서, 향성 인자는 표 4에 제시된 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 그기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97 %, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질이다. 특정 실시형태에서, 당단백질은 VSV-G이다. 특정 실시형태에서, 당단백질은 서열번호: 438의 서열을 포함한다.
치료 페이로드는 단백질, 핵산, 또는 단백질과 핵산 둘 모두일 수 있다. XDP 시스템의 일부 실시형태에서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, 리보뉴클레아제(RNAse), 데옥시리보뉴클레아제(DNAse), 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해성 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택된다. 일 실시형태에서, 치료 페이로드는 클래스 1 또는 클래스 2 CRISPR 단백질이고, 여기서 클래스 2 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된다. 일 실시형태에서, 클래스 2 CRISPR 유형 V 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택되고, 여기서 CasX는 표 1, 7, 8, 9, 또는 11에 제시된 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 그기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, CasX는 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함한다. 일부 실시형태에서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택되는 핵산이고, 여기서 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적이고, 여기서 스캐폴드 서열은 표 3에 제시된 서열번호: 597-781의 서열, 또는 그기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, 스캐폴드 서열은 서열번호: 597-781의 서열을 포함한다.
일부 실시형태에서, XDP 시스템은 하나 이상의 프로테아제 절단 부위, gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR), 레트로바이러스 gag-pol 폴리단백질, 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스 프로테아제로부터 선택된 하나 이상의 성분을 인코딩하는 핵산을 추가로 포함한다. 일부 실시형태에서, XDP 시스템의 레트로바이러스 성분은 오르소레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되며 여기서 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 및 렌티바이러스로 구성된 군으로부터 선택되고, 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스로 구성된 군에서 선택된다.
일부 실시형태에서, XDP 시스템의 성분은 단일 핵산, 2개의 핵산, 3개의 핵산, 4개의 핵산, 또는 5개의 핵산 상에 인코딩되고, 핵산은 도 36-68 중 어느 하나에 따라 구성된다. 일부 실시형태에서, XDP 시스템의 성분은 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 및 234-339의 서열의 군으로부터 선택된 핵산에 의해 인코딩된다.
일부 실시형태에서, XDP 시스템의 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블링될 수 있다. 전기한 실시형태에서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화된다. 치료 페이로드가 CasX 및 가이드 RNA를 포함하는 특정 실시형태에서, CasX 및 가이드 RNA는 리보핵단백질 복합체(RNP)로서 복합화되고, 선택적으로, 공여자 주형은 또한 XDP에 캡슐화된다. 또 다른 특정 실시형태에서, XDP의 자가-어셈블리 시 XDP 표면에 향성 인자가 통합된다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 알파레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 베타레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 델타레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 엡실론레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA) 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 감만레트로바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA) 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 렌티바이러스 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
XDP 시스템의 일부 실시형태에서, 레트로바이러스 성분을 인코딩하는 핵산은 스푸마레트로바이러스아과 gag 폴리단백질의 전부 또는 일부이며, 여기서 gag 폴리단백질은 p68 Gag 폴리펩티드 및 p3 gag 폴리펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함한다. XDP 시스템의 일부 실시형태에서, 핵산은 HIV p1 펩티드, HIV p6 펩티드, Gag-Pol 폴리단백질, 하나 이상의 프로테아제 절단 부위, 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제, 및 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는 서열을 추가로 포함한다.
CasX 시스템의 일부 실시형태에서, CasX는 PKKKRKV(서열번호: 130), KRPAATKKAGQAKKKK (서열번호: 131), PAAKRVKLD (서열번호: 132), RQRRNELKRSP (서열번호: 133), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY (서열번호: 134), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV (서열번호: 135), VSRKRPRP (서열번호: 136), PPKKARED (서열번호: 137), PQPKKKPL (서열번호: 138), SALIKKKKKMAP (서열번호: 139), DRLRR (서열번호: 140), PKQKKRK (서열번호: 141), RKLKKKIKKL (서열번호: 142), REKKKFLKRR (서열번호: 143), KRKGDEVDGVDEVAKKKSKK (서열번호: 144), RKCLQAGMNLEARKTKK (서열번호: 145), PRPRKIPR (서열번호: 146), PPRKKRTVV (서열번호: 147), NLSKKKKRKREK (서열번호: 148), RRPSRPFRKP (서열번호: 149), KRPRSPSS (서열번호: 150), KRGINDRNFWRGENERKTR (서열번호: 151), PRPPKMARYDN (서열번호: 152), KRSFSKAF (서열번호: 153), KLKIKRPVK (서열번호: 154), PKTRRRPRRSQRKRPPT (서열번호: 156), RRKKRRPRRKKRR (서열번호: 159), PKKKSRKPKKKSRK (서열번호: 160), HKKKHPDASVNFSEFSK (서열번호: 161), QRPGPYDRPQRPGPYDRP (서열번호: 162), LSPSLSPLLSPSLSPL (서열번호: 163), RGKGGKGLGKGGAKRHRK (서열번호: 164), PKRGRGRPKRGRGR (서열번호: 165), MSRRRKANPTKLSENAKKLAKEVEN (서열번호: 157), PKKKRKVPPPPAAKRVKLD (서열번호: 155), 및 PKKKRKVPPPPKKKRKV (서열번호: 166)로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하며, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치된다.
XDP 시스템의 일부 실시형태에서, 비-레트로바이러스의 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, 파스닙 황색 반점 바이러스 프로테아제, 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 및 엔테로키나제로 구성된 군으로부터 선택된다.
다른 양태에서, 본 개시내용은 전술한 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포를 제공하며, 여기서 세포는 패키징 세포이다. 일부 실시형태에서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택된다.
다른 양태에서, 본 개시내용은 치료 페이로드를 포함하는 XDP를 제조하는 방법을 제공하며, 상기 방법은 XDP가 생성되도록 하는 조건 하에서 임의의 실시형태의 패키징 세포를 증식시키는 것, 및 패키징 세포에 의해 생성된 XDP를 수확하는 것을 포함한다. 본 개시내용은 전술한 방법에 의해 생성된 XDP를 추가로 제공한다. 특정 실시형태에서, XDP는 CasX 및 가이드 RNA의 RNP의 치료 페이로드, 및 선택적으로, 본 명세서에 개시된 임의의 실시형태의 공여자 주형을 포함한다.
다른 양태에서, 본 개시내용은 세포에서 표적 핵산 서열을 변형시키는 방법을 제공하며, 상기 방법은 세포를 본 명세서에 개시된 임의의 실시형태의 RNP를 포함하는 XDP와 접촉시키는 것을 포함하고, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA, 및 선택적으로 공여자 주형 핵산 서열을 포함하는 RNP를 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함한다. 일부 경우에, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함한다. 다른 경우에, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함한다. 또 다른 경우에, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함한다. 일 실시형태에서, 세포는 시험관내 또는 생체외에서 변형된다. 또 다른 실시형태에서, 세포는 생체내에서 변형된다. 전술한 실시형태에서, XDP는 치료적으로 유효한 용량으로 대상체에게 투여되며, 여기서 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체이다. 일부 실시형태에서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척수강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택된 투여 경로에 의해 투여된다. 일부 실시형태에서, 치료적으로 유효한 용량은 적어도 약 1 x 105 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg이다. 일부 실시형태에서, XDP는 XDP의 치료적으로 유효한 용량을 사용하여 하나 이상의 연속 용량을 포함하는 치료 요법에 따라 대상체에게 투여된다. 일부 실시형태에서, 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 1회, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여된다.
또 다른 양태에서, 질환을 갖는 대상체의 치료를 위한 약제로서 사용하기 위한 XDP 입자, 및 XDP 시스템이 본 명세서에서 제공된다.
참조에 의한 통합
본 명세서에 언급된 모든 간행물, 특허 및 특허 출원은 각각의 개별 간행물, 특허 또는 특허 출원이 참고로 포함되는 것으로 구체적이고 개별적으로 표시된 것처럼 동일한 정도로 참고로 본 명세서에 포함된다. 2020년 6월 5일에 출원된 PCT/US2020/036505 및 2020년 12월 3일에 출원된 "조작된 CasX 시스템"이라는 제목의 미국 가출원의 내용은, 두 출원 모두 CasX 변이체 및 gNA 변종을 개시하는 것으로, 그 전체로 본 명세서에 참고로 포함된다.
발명의 신규한 특징은 첨부된 청구범위에서 구체적으로 제시된다. 본 발명의 특징 및 이점에 대한 더 나은 이해는 발명의 원리가 활용되는 예시적인 실시형태를 제시하는 다음의 상세한 설명 및 다음 첨부 도면을 참고하여 얻어질 것이다:
도 1은 실시예 1에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 StX2 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 2는 실시예 1에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한, StX2의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 3은 실시예 1에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 StX2 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 4는 실시예 2에 기재된 CasX 작제물을 어셈블링하는데 사용된 pSTX34 플라스미드에서 성분의 조직화를 보여주는 개략도이다.
도 5는 실시예 2에 기재된 CasX 119 변이체를 생성하는 단계를 보여주는 개략도이다.
도 6은 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 7은 실시예 2에 기재된 슈퍼덱스 200 16/600pg 겔 여과의 크로마토그램을 나타낸다.
도 8은 실시예 2에 기재된 콜로이드성 쿠마시로 염색된 겔 여과 샘플의 SDS-PAGE 겔을 나타낸다.
도 9는 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 CasX 438의 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 10은 실시예 2에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한 CasX 438의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 11은 실시예 2에 기재된 실시예에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 CasX 438 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 12는 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 CasX 457의 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 13은 실시예 2에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한 CasX 457의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 14는 실시예 2에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 CasX 457 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 15는 실시예 9에 기재된 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 활성 분획의 정량화에 대한 검정 결과의 그래프이다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 2상 적합이 표시된다. "2"는 서열번호:2의 참조 CasX 단백질을 지칭한다.
도 16은 실시예 9에 기재된 CasX2(서열번호:2의 참조 CasX 단백질) 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 나타낸다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 2상 적합이 표시된다.
도 17은 실시예 9에 기재된 가이드-제한 조건 하에서 CasX 491 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 나타낸다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 데이터의 2상 적합이 표시된다.
도 18은 실시예 9에 기재된 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 단일 복제가 표시되는 488 및 491을 제외하고 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 단상 적합이 표시된다.
도 19는 실시예 9에 기재된 CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 단상 적합이 표시된다.
도 20은 실시예 9에 기재된 CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 초기 속도의 정량화를 나타낸다. 이전 절단 실험의 처음 2개 시점은 초기 절단 속도를 결정하기 위해 선형 모델로 피팅되었다.
도 21은 실시예 9에 기재된 CasX491 및 sgRNA 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 10℃에서 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 시점의 단상 적합이 표시된다.
도 22a-d는 실시예 10에 기재된 NTC PAM에 대한 CasX 변이체의 절단 속도의 정량화를 나타낸다. 동일한 스페이서 및 표시된 PAM 서열을 갖는 표적 DNA 기질을 37℃에서 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양은 표시된 시점에서 결정하였다. 단일 복제의 단상 적합이 표시된다. 도 22a는 TTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22b는 CTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22c는 GTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22d는 ATC PAM을 갖는 서열에 대한 결과를 나타낸다.
도 23은 실시예 13에 기재된 CasX, gNA, 및 슈도타입인 단백질을 포함하는 XDP의 생성에 활용된 플라스미드를 도시한다.
도 24는 실시예 13에 기재된 XDP의 생성에 사용하는 단계의 개략도이다.
도 25는 실시예 16에 기재된 dtTomato 분석의 편집 결과의 그래프이다.
도 26a는 실시예 17에 기재된 VSV-G의 일련의 농도로 슈도타입의 XDP를 갖는 마우스 tdTomato 신경 전구 세포(NPC)에서의 백분율 편집의 결과를 나타낸다.
도 26b는 실시예 17에 기재된 상업적으로 이용가능한 Lenti-X p24 ELISA 키트에 의해 측정된 XDP 역가를 나타낸다.
도 27은 실시예 17에 기재된 상이한 당단백질로 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집의 백분율을 나타낸다.
도 28a는 실시예 17에 기재된 VSV-G 슈도타입의 XDP(1X 및 10X 농축된 둘 모두), 광견병 슈도타입의 XDP 및 렌티바이러스(LV)의 크기 분포 및 바이러스 역가 비교의 결과를 나타낸다.
도 28b는 실시예 17에 기재된 VSV-G XDP, LV 및 광견병 XDP 간의 크기 비교를 나타낸다.
도 29는 실시예 18에 기재된 상이한 RNP를 담지하는 VSV-G 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집 백분율의 결과를 나타낸다.
도 30은 실시예 19에 기재된 적정된 양의 Gag-Pol 대 Gag-Stx(Stx 작제물)를 갖는 VSV-G 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집 백분율을 나타낸다.
도 31은 실시예 19에 기재된 다양한 양의 Gag-Pol 대 Gag-Stx 작제물을 갖는 이들 상이한 XDP에 대한 역가를 나타낸다.
도 32는 실시예 19에 기재된 QPCR에 의해 평가된 바와 같은 상이한 작제물에 대한 XDP 역가당 가이드 RNA의 양을 나타낸다.
도 33은 실시예 20에 기재된 2개의 상이한 B2M 표적화 스페이서 및 1개의 비표적화 스페이서를 함유하는 XDP에 의한 B2M의 상대적 녹아웃 비율의 결과를 나타낸다.
도 34는 실시예 14에 기재된 XDP 입자에 대한 원심분리 정제 공정 전반에 걸쳐 채취한 샘플의 대표적인 SDS-PAGE 및 웨스턴 블롯 이미지를 나타낸다.
도 35는 실시예 21에 기재된 버전 7, 버전 122 및 버전 123으로 구성된 XDP에 대한 편집 검정의 결과를 나타낸다.
도 36a는 버전 1 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 36b는 버전 2 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 37a는 버전 3 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 37b는 버전 4 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 38a는 버전 5 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 38b는 버전 6 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 39a는 버전 7 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 39b는 버전 8 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 40a는 버전 9 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 40b는 버전 10 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 41a는 버전 11 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 41b는 버전 12 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 42a는 버전 13 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 42b는 버전 14 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 43a는 버전 15 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 43b는 버전 16 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 44a는 버전 24 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 44b는 버전 25 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 45a는 버전 26 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 45b는 버전 27 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 46a는 버전 31 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 46b는 버전 32 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 47a는 버전 33 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 47b는 버전 34 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 48a는 버전 35 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 48b는 버전 36 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 49a는 버전 37 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 49b는 버전 38 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 50a는 버전 39 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 50b는 버전 40 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 51a는 버전 17 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 51b는 버전 18 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 52a는 버전 44 및 45 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 52b는 버전 46, 47, 62 및 90 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 53a는 버전 48, 49 및 63 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 53b는 버전 50 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 54a는 버전 51 및 52 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 54b는 버전 53, 54, 55 및 91 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 55a는 버전 56-61 및 92 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 55b는 버전 66a 및 67a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 56a는 버전 66b 및 67b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 56b는 버전 68a, 69a, 70a 및 87a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 57a는 버전 68b, 69b, 70b 및 87b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 57b는 버전 71a, 72a 및 88a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 58a는 버전 71b, 72b 및 88b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 58b는 버전 73a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 59a는 버전 73b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 59b는 버전 74a 및 75a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 60a는 버전 74b 및 75b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 60b는 버전 76a, 77a, 78a, 및 79a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 61a는 버전 76b, 77b, 78b, 및 79b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 61b는 버전 80a, 81a, 82a, 83a, 84a, 85a 및 86a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 62a는 버전 80b, 81b, 82b, 83b, 84b, 85b, 및 86b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 62b는 버전 102 및 114 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 63a는 버전 103, 108, 및 109 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 63b는 버전 104, 105, 115, 116 및 117 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 64a는 버전 106, 111, 112, 83b 및 113 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 64b는 버전 107 및 110 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 65는 버전 118 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 66a는 버전 122 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 66b는 버전 103 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 67a는 버전 124 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 67b는 버전 126 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 68은 버전 128 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 69a 및 69b는 실시예 22에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 70은 실시예 22에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 71a 및 71b는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 72는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 73a 및 73b는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 74는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 75a 및 75b는 실시예 25에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 76은 실시예 25에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 77은 실시예 26에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 78은 실시예 26에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 1은 실시예 1에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 StX2 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 2는 실시예 1에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한, StX2의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 3은 실시예 1에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 StX2 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 4는 실시예 2에 기재된 CasX 작제물을 어셈블링하는데 사용된 pSTX34 플라스미드에서 성분의 조직화를 보여주는 개략도이다.
도 5는 실시예 2에 기재된 CasX 119 변이체를 생성하는 단계를 보여주는 개략도이다.
도 6은 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 7은 실시예 2에 기재된 슈퍼덱스 200 16/600pg 겔 여과의 크로마토그램을 나타낸다.
도 8은 실시예 2에 기재된 콜로이드성 쿠마시로 염색된 겔 여과 샘플의 SDS-PAGE 겔을 나타낸다.
도 9는 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 CasX 438의 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 10은 실시예 2에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한 CasX 438의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 11은 실시예 2에 기재된 실시예에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 CasX 438 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 12는 실시예 2에 기재된 Bio-Rad Stain-Free™ 겔 상에서 가시화된 CasX 457의 정제 샘플의 SDS-PAGE 겔을 나타낸다.
도 13은 실시예 2에 기재된 슈퍼덱스 200 16/600 pg 겔 여과를 사용한 CasX 457의 크기 배제 크로마토그래피 검정으로부터의 크로마토그램을 나타낸다.
도 14는 실시예 2에 기재된 콜로이드성 쿠마시 염색에 의해 가시화된 CasX 457 정제 분획의 SDS-PAGE 겔을 나타낸다.
도 15는 실시예 9에 기재된 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 활성 분획의 정량화에 대한 검정 결과의 그래프이다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 2상 적합이 표시된다. "2"는 서열번호:2의 참조 CasX 단백질을 지칭한다.
도 16은 실시예 9에 기재된 CasX2(서열번호:2의 참조 CasX 단백질) 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 나타낸다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 2상 적합이 표시된다.
도 17은 실시예 9에 기재된 가이드-제한 조건 하에서 CasX 491 및 변형된 sgRNA에 의해 형성된 RNP의 활성 분획의 정량화를 나타낸다. 등몰량의 RNP 및 표적을 공동-인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 데이터의 2상 적합이 표시된다.
도 18은 실시예 9에 기재된 sgRNA174 및 CasX 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 단일 복제가 표시되는 488 및 491을 제외하고 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 단상 적합이 표시된다.
도 19는 실시예 9에 기재된 CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 3개의 독립적인 복제의 평균 및 표준 편차가 각 시점에 대해 표시된다. 조합된 복제의 단상 적합이 표시된다.
도 20은 실시예 9에 기재된 CasX2 및 sgRNA 변이체에 의해 형성된 RNP의 초기 속도의 정량화를 나타낸다. 이전 절단 실험의 처음 2개 시점은 초기 절단 속도를 결정하기 위해 선형 모델로 피팅되었다.
도 21은 실시예 9에 기재된 CasX491 및 sgRNA 변이체에 의해 형성된 RNP의 절단 속도의 정량화를 나타낸다. 표적 DNA를 10℃에서 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양을 표시된 시점에서 결정하였다. 시점의 단상 적합이 표시된다.
도 22a-d는 실시예 10에 기재된 NTC PAM에 대한 CasX 변이체의 절단 속도의 정량화를 나타낸다. 동일한 스페이서 및 표시된 PAM 서열을 갖는 표적 DNA 기질을 37℃에서 표시된 RNP의 20-배 과잉으로 인큐베이션하고 절단된 표적의 양은 표시된 시점에서 결정하였다. 단일 복제의 단상 적합이 표시된다. 도 22a는 TTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22b는 CTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22c는 GTC PAM을 갖는 서열에 대한 결과를 나타낸다. 도 22d는 ATC PAM을 갖는 서열에 대한 결과를 나타낸다.
도 23은 실시예 13에 기재된 CasX, gNA, 및 슈도타입인 단백질을 포함하는 XDP의 생성에 활용된 플라스미드를 도시한다.
도 24는 실시예 13에 기재된 XDP의 생성에 사용하는 단계의 개략도이다.
도 25는 실시예 16에 기재된 dtTomato 분석의 편집 결과의 그래프이다.
도 26a는 실시예 17에 기재된 VSV-G의 일련의 농도로 슈도타입의 XDP를 갖는 마우스 tdTomato 신경 전구 세포(NPC)에서의 백분율 편집의 결과를 나타낸다.
도 26b는 실시예 17에 기재된 상업적으로 이용가능한 Lenti-X p24 ELISA 키트에 의해 측정된 XDP 역가를 나타낸다.
도 27은 실시예 17에 기재된 상이한 당단백질로 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집의 백분율을 나타낸다.
도 28a는 실시예 17에 기재된 VSV-G 슈도타입의 XDP(1X 및 10X 농축된 둘 모두), 광견병 슈도타입의 XDP 및 렌티바이러스(LV)의 크기 분포 및 바이러스 역가 비교의 결과를 나타낸다.
도 28b는 실시예 17에 기재된 VSV-G XDP, LV 및 광견병 XDP 간의 크기 비교를 나타낸다.
도 29는 실시예 18에 기재된 상이한 RNP를 담지하는 VSV-G 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집 백분율의 결과를 나타낸다.
도 30은 실시예 19에 기재된 적정된 양의 Gag-Pol 대 Gag-Stx(Stx 작제물)를 갖는 VSV-G 슈도타입의 XDP를 갖는 마우스 tdTomato NPC에서의 편집 백분율을 나타낸다.
도 31은 실시예 19에 기재된 다양한 양의 Gag-Pol 대 Gag-Stx 작제물을 갖는 이들 상이한 XDP에 대한 역가를 나타낸다.
도 32는 실시예 19에 기재된 QPCR에 의해 평가된 바와 같은 상이한 작제물에 대한 XDP 역가당 가이드 RNA의 양을 나타낸다.
도 33은 실시예 20에 기재된 2개의 상이한 B2M 표적화 스페이서 및 1개의 비표적화 스페이서를 함유하는 XDP에 의한 B2M의 상대적 녹아웃 비율의 결과를 나타낸다.
도 34는 실시예 14에 기재된 XDP 입자에 대한 원심분리 정제 공정 전반에 걸쳐 채취한 샘플의 대표적인 SDS-PAGE 및 웨스턴 블롯 이미지를 나타낸다.
도 35는 실시예 21에 기재된 버전 7, 버전 122 및 버전 123으로 구성된 XDP에 대한 편집 검정의 결과를 나타낸다.
도 36a는 버전 1 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 36b는 버전 2 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 37a는 버전 3 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 37b는 버전 4 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 38a는 버전 5 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 38b는 버전 6 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 39a는 버전 7 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 39b는 버전 8 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 40a는 버전 9 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 40b는 버전 10 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 41a는 버전 11 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 41b는 버전 12 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 42a는 버전 13 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 42b는 버전 14 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 43a는 버전 15 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 43b는 버전 16 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 44a는 버전 24 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 44b는 버전 25 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 45a는 버전 26 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 45b는 버전 27 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 46a는 버전 31 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 46b는 버전 32 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 47a는 버전 33 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 47b는 버전 34 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 48a는 버전 35 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 48b는 버전 36 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 49a는 버전 37 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 49b는 버전 38 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 50a는 버전 39 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 50b는 버전 40 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 51a는 버전 17 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 51b는 버전 18 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 52a는 버전 44 및 45 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 52b는 버전 46, 47, 62 및 90 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 53a는 버전 48, 49 및 63 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 53b는 버전 50 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 54a는 버전 51 및 52 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 54b는 버전 53, 54, 55 및 91 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 55a는 버전 56-61 및 92 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 55b는 버전 66a 및 67a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 56a는 버전 66b 및 67b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 56b는 버전 68a, 69a, 70a 및 87a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 57a는 버전 68b, 69b, 70b 및 87b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 57b는 버전 71a, 72a 및 88a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 58a는 버전 71b, 72b 및 88b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 58b는 버전 73a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 59a는 버전 73b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 59b는 버전 74a 및 75a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 60a는 버전 74b 및 75b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 60b는 버전 76a, 77a, 78a, 및 79a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 61a는 버전 76b, 77b, 78b, 및 79b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 61b는 버전 80a, 81a, 82a, 83a, 84a, 85a 및 86a XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 62a는 버전 80b, 81b, 82b, 83b, 84b, 85b, 및 86b XDP 및 XDP를 생성하기 위한 형질감염에 사용된 4개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 62b는 버전 102 및 114 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 63a는 버전 103, 108, 및 109 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 63b는 버전 104, 105, 115, 116 및 117 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 64a는 버전 106, 111, 112, 83b 및 113 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 64b는 버전 107 및 110 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 65는 버전 118 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 66a는 버전 122 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 66b는 버전 103 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 67a는 버전 124 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 67b는 버전 126 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 68은 버전 128 XDP 및 XDP를 생성하기 위한 형질감염에 사용된 3개의 플라스미드에 대한 성분의 구성에 대한 개략도를 나타낸다.
도 69a 및 69b는 실시예 22에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 70은 실시예 22에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 71a 및 71b는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 72는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 73a 및 73b는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 74는 실시예 23에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 75a 및 75b는 실시예 25에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 76은 실시예 25에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 77은 실시예 26에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
도 78은 실시예 26에 기재된 다양한 XDP 버전의 편집 검정의 결과를 나타낸다.
본 발명의 바람직한 실시형태가 본 명세서에 도시되고 기술되었지만, 그러한 실시형태는 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 수많은 변형, 변경 및 대체가 이제 발명을 벗어나지 않고 당업자에게 발생할 것이다. 본 명세서에 기재된 발명의 실시형태에 대한 다양한 대안이 발명을 실시하는데 이용될 수 있음이 이해되어야 한다. 다음 청구범위는 발명의 범주를 정의하고 이들 청구범위 및 그 균등물의 범주 내의 방법 및 구조는 이에 의해 커버되는 것으로 의도된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상인에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 등가인 방법 및 물질이 본 실시형태의 실시 또는 시험에서 사용될 수 있지만, 적합한 방법 및 물질이 아래에 기술된다. 충돌하는 경우 정의를 포함한 특허 명세서가 우선한다. 부가하여, 물질, 방법 및 실시예는 예시일 뿐이며 제한하려는 의도가 아니다. 수많은 변형, 변경 및 대체가 이제 발명을 벗어나지 않고 기술 분야에서 통상인에게 발생할 것이다.
정의
본 명세서에서 상호교환가능하게 사용되는 용어 "폴리뉴클레오티드" 및 "핵산"은 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 중 어느 하나의 임의의 길이의 뉴클레오티드의 중합체 형태를 지칭한다. 따라서, 용어 "폴리뉴클레오티드" 및 "핵산"은 단일-가닥 DNA; 이중-가닥 DNA; 다중-가닥 DNA; 단일-가닥 RNA; 이중-가닥 RNA; 다중-가닥 RNA; 게놈 DNA; cDNA; DNA-RNA 하이브리드; 및 퓨린 및 피리미딘 염기 또는 기타 천연, 화학적 또는 생화학적으로 변형된, 비-천연 또는 유도체화된 뉴클레오티드 염기를 포함하는 중합체를 포괄한다.
"혼성화가능한" 또는 "상보적인"은 핵산(예를 들어, RNA, DNA)이 비-공유적으로 결합, 즉 Watson-Crick 염기쌍 및/또는 G/U 염기쌍을 형성하거나, 온도 및 용액 이온 강도의 적절한 시험관내 및/또는 생체내 조건 하에서 서열-특이적, 역평행 방식으로 또 다른 핵산에 "어닐링" 또는 "하이브리드화" (즉, 핵산이 상보적 핵산에 특이적으로 결합함)할 수 있게 하는 뉴클레오티드의 서열을 포함한다는 것을 의미하기 위해 상호교환적으로 사용된다. 폴리뉴클레오티드의 서열은 특이적으로 혼성화가능할 수 있는 그 표적 핵산의 서열에 100% 상보적일 필요는 없는 것으로 이해되며; 이것은 적어도 약 70%, 적어도 약 80%, 또는 적어도 약 90%, 또는 적어도 약 95% 서열 동일성을 가질 수 있고 여전히 표적 핵산에 혼성화가능하다. 더욱이, 폴리뉴클레오티드는 개재하는 또는 인접한 세그먼트가 혼성화 이벤트(예를 들어, 고리 구조 또는 헤어핀 구조, '벌지', '버블' 등)에 관여하지 않도록 하나 이상의 세그먼트에 걸쳐 혼성화할 수 있다.
본 개시내용의 목적을 위한 "유전자"는 유전자 생성물(예를 들어, 단백질, RNA)을 인코딩하는 DNA 영역 뿐만 아니라, 그러한 조절 서열이 코딩 및/또는 전사된 서열에 인접하든 하지 않든, 유전자 생성물의 생산을 조절하는 모든 DNA 영역을 포함한다. 따라서, 유전자는 프로모터 서열, 터미네이터, 번역 조절 서열 예컨대 리보솜 결합 부위 및 내부 리보솜 진입 부위, 인핸서, 사일런서, 절연체, 경계 요소, 복제 기점, 매트릭스 부착 부위 및 좌위 제어 영역을 포함하지만 이에 필수적으로 제한되지 않는 조절 요소 서열을 포함할 수 있다. 코딩 서열은 전사 또는 전사 및 번역 시 유전자 산물을 인코딩하며; 개시내용의 코딩 서열은 단편을 포함할 수 있고 전장 개방 판독 프레임을 함유할 필요는 없다. 유전자는 전사되는 가닥뿐만 아니라 안티코돈을 함유하는 상보적 가닥 둘 모두를 포함할 수 있다.
용어 "다운스트림"는 참조 뉴클레오티드 서열의 3'에 위치한 뉴클레오티드 서열을 지칭한다. 특정 실시형태에서, 다운스트림 뉴클레오티드 서열은 전사의 시작점을 따르는 서열에 관한 것이다. 예를 들어, 유전자의 번역 개시 코돈은 전사의 시작 부위의 다운스트림에 위치한다.
용어 "업스트림"는 참조 뉴클레오티드 서열의 5'에 위치한 뉴클레오티드 서열을 지칭한다. 특정 실시형태에서, 업스트림 뉴클레오티드 서열은 코딩 영역 또는 전사의 시작점의 5' 측에 위치하는 서열에 관한 것이다. 예를 들어, 대부분의 프로모터는 전사의 시작 부위의 업스트림에 위치한다.
용어 "조절 요소"는 본 명세서에서 용어 "조절 서열"과 상호교환적으로 사용되고, 프로모터, 인핸서 및 기타 발현 조절 요소(예를 들어, 전사 종결 신호, 예컨대 폴리아데닐화 신호 및 폴리-U 서열)를 포함하는 것으로 의도된다. 예시적인 조절 요소는 전사 프로모터 예컨대, 이에 제한되지는 않지만, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, 신장 인자 1 알파(EF1α), MMLV-ltr, 내부 리보솜 진입 부위(IRES) 또는 단일 전사체로부터 다중 유전자의 번역을 허용하는 P2A 펩티드, 메탈로티오네인, 전사 인핸서 요소, 전사 종결 신호, 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 엑손 스키핑에 이용되는 시스템의 경우, 조절 요소는 엑손 스플라이싱 인핸서를 포함한다. 적절한 조절 요소의 선택은 발현되어 지는 인코딩된 성분(예를 들어, 단백질 또는 RNA) 또는 핵산이 상이한 폴리머라제를 필요로 하거나 융합 단백질로 발현되도록 의도되지 않은 다중 성분을 포함하는지 여부에 의존할 것이다는 것이 이해될 것이다.
용어 "프로모터"는 RNA 폴리머라제 결합 부위, 전사 시작 부위, TATA 박스, 및/또는 B 인식 요소를 함유하고 연관된 전사가능한 폴리뉴클레오티드 서열 및/또는 유전자(또는 이식유전자)의 전사 및 발현을 보조하거나 촉진하는 DNA 서열을 지칭한다. 프로모터는 합성적으로 생성될 수 있거나 공지된 또는 자연적으로 발생하는 프로모터 서열 또는 또 다른 프로모터 서열로부터 유래될 수 있다. 프로모터는 전사되어 지는 유전자의 근위 또는 원위일 수 있다. 프로모터는 또한 특정 특성을 부여하기 위해 2개 이상의 이종성 서열의 조합을 포함하는 키메라 프로모터를 포함할 수 있다. 본 개시내용의 프로모터는 조성이 유사하지만 본 명세서에 공지되거나 제공된 다른 프로모터 서열(들)과 동일하지 않은 프로모터 서열의 변이체를 포함할 수 있다. 프로모터는 구성적, 발달적, 조직-특이적, 유도성 등과 같이 프로모터에 작동가능하게 연결된 연관된 코딩 또는 전사가능한 서열 또는 유전자의 발현의 패턴과 관련된 기준에 따라 분류될 수 있다.
용어 "인핸서"는 전사 인자라고 하는 특정 단백질에 의해 결합될 때 연관된 유전자의 발현을 조절하는 조절 DNA 서열을 지칭한다. 인핸서는 유전자의 인트론, 또는 유전자의 코딩 서열의 5' 또는 3'에 위치할 수 있다. 인핸서는 유전자에 근접하거나(즉, 프로모터의 수십 또는 수백의 염기쌍(bp) 내), 유전자에서 원위에 위치할 수 있다(즉, 프로모터로부터 수천 bp, 수십만 bp 또는 심지어 수백만 bp 떨어져 있음). 단일 유전자는 하나 초과의 인핸서에 의해 조절될 수 있으며, 이들 모두는 본 개시내용의 범주 내인 것으로 고려된다.
본 명세서에 사용된 "재조합"은 특정 핵산(DNA 또는 RNA)이 자연계에서 발견되는 내인성 핵산과 구별가능한 구조적 코딩 또는 비-코딩 서열을 갖는 작제물을 생성하는 클로닝, 제한 및/또는 결찰 단계의 다양한 조합의 산물임을 의미한다. 일반적으로, 구조적 코딩 서열을 인코딩하는 DNA 서열은 cDNA 단편 및 짧은 올리고뉴클레오티드 링커, 또는 일련의 합성 올리고뉴클레오티드로부터 어셈블링되어 세포 또는 세포-유리 전사 및 번역 시스템에 함유된 재조합 전사 단위로부터 발현될 수 있는 합성 핵산을 제공할 수 있다. 이러한 서열은 전형적으로 진핵생물 유전자에 존재하는 내부 비-번역된 서열, 또는 인트론에 의해 중단되지 않는 개방 판독 프레임의 형태로 제공될 수 있다. 관련 서열을 포함하는 게놈 DNA는 또한 재조합 유전자 또는 전사 단위의 형성에 사용될 수 있다. 비-번역된 DNA의 서열은 개방 판독 프레임으로부터 5' 또는 3'에 존재할 수 있으며, 여기서 그러한 서열은 코딩 영역의 조작 또는 발현을 방해하지 않으며 실제로 다양한 메커니즘에 의해 원하는 생성물의 생산을 조절하는 작용을 할 수 있다(상기의 "인핸서" 및 "프로모터" 참고).
용어 "재조합 폴리뉴클레오티드" 또는 "재조합 핵산"은 자연적으로 발생하지 않는 것, 예를 들어 인간 개입을 통해 2개의 달리 분리된 서열 세그먼트의 인공적 조합에 의해 만들어진 것을 지칭한다. 이 인공적 조합은 종종 화학적 합성 수단에 의해 또는 예를 들어 유전 공학 기술에 의해 단리된 핵산 세그먼트의 인공적 조작에 의해 달성된다. 이는 전형적으로 서열 인식 부위를 도입하거나 제거하면서 동일하거나 보존적 아미노산을 인코딩하는 중복 코돈으로 코돈을 대체하기 위해 일반적으로 수행된다. 대안적으로, 그것은 원하는 기능의 조합을 생성하기 위해 원하는 기능의 핵산 세그먼트를 함께 결합하기 위해 수행된다. 이 인공적 조합은 종종 화학적 합성 수단에 의해 또는 예를 들어 유전 공학 기술에 의해 단리된 핵산 세그먼트의 인공적 조작에 의해 달성된다.
유사하게, 용어 "재조합 폴리펩티드" 또는 "재조합 단백질"은 자연적으로 발생하지 않는, 예를 들어 인간 개입을 통해 2개의 달리 분리된 아미노 서열 세그먼트의 인공적 조합에 의해 만들어진 폴리펩티드 또는 단백질을 지칭한다. 따라서, 예를 들어, 이종성 아미노산 서열을 포함하는 단백질은 재조합이다.
본 명세서에 사용된, 용어 "접촉하는"은 둘 이상의 엔티티 사이에 물리적 연결을 설정하는 것을 의미한다. 예를 들어, 표적 핵산을 가이드 핵산과 접촉시키는 것은 표적 핵산과 가이드 핵산이 물리적 연결을 공유하도록 만드는 것; 예를 들어, 서열이 서열 유사성을 공유한다면 혼성화할 수 있는 것을 의미한다.
"해리 상수" 또는 "Kd"는 상호교환적으로 사용되고 리간드 "L"과 단백질 "P" 사이의 친화도; 즉, 리간드가 특정 단백질에 얼마나 단단히 결합하는지를 의미한다. 그것은 공식 Kd=[L][P]/[LP]를 사용하여 계산할 수 있으며, 여기서 [P], [L] 및 [LP]는 각각 단백질, 리간드 및 복합체의 몰 농도를 나타낸다.
개시내용은 표적 핵산을 변형하는데 유용한 조성물 및 방법을 제공한다. 본 명세서에 사용된 "변형"은 절단, 닉킹, 편집, 결실, 녹인, 녹아웃 등을 포함하지만 이에 제한되지 않는다.
용어 "녹-아웃"은 유전자의 제거 또는 유전자의 발현을 지칭한다. 예를 들어, 유전자는 판독 프레임의 붕괴를 초래하는 뉴클레오티드 서열의 결실 또는 추가에 의해 녹아웃될 수 있다. 또 다른 예로서, 유전자는 유전자의 일부를 관련 없는 서열로 대체함에 의해 녹아웃될 수 있다. 본 명세서에 사용된 용어 "녹-다운"은 유전자의 발현 또는 이의 유전자 생성물(들)에서 감소를 지칭한다. 유전자 녹-다운의 결과로 단백질 활성 또는 기능이 약화되거나 단백질 수준이 감소 또는 제거될 수 있다.
본 명세서에 사용된 "상동성-지향된 복구"(HDR)는 세포에서 이중-가닥 파손의 복구 동안 발생하는 DNA 복구의 형태를 지칭한다. 이 과정은 뉴클레오티드 서열 상동성을 요하고, 공여자 주형을 사용하여 표적 DNA를 복구하거나 녹-아웃시키고, 공여자로부터 표적으로 유전 정보의 전달을 야기한다. 상동성-지향된 복구는 공여자 주형이 표적 DNA 서열과 다르고 공여자 주형의 서열의 일부 또는 전부가 표적 DNA 안으로 통합되는 경우 삽입, 결실 또는 돌연변이에 의해 표적 서열의 서열 변경을 초래할 수 있다.
본 명세서에 사용된 "비-상동성 말단 연결"(NHEJ)은 (가이드 복구를 위해 상동성 서열을 요하는, 상동성-지향된 복구에 대비하여) 상동성 주형이 필요 없이 파손 말단을 서로 직접 결찰에 의해 DNA에서 이중-가닥 파손의 복구를 지칭한다. NHEJ는 종종 이중-가닥 파손의 부위 근처의 뉴클레오티드 서열의 손실(결실)을 초래한다.
본 명세서에 사용된 "마이크로-상동성 매개된 말단 연결"(MMEJ)은 (가이드 복구를 위해 상동성 서열을 요하는, 상동성-지향된 복구에 대비하여) 상동성 주형이 필요 없이 파손 부위를 측접하는 결실과 항상 연관되는, 돌연변이유발 DSB 복구 메커니즘을 지칭한다. MMEJ는 종종 이중-가닥 파손의 부위 근처의 뉴클레오티드 서열의 손실(결실)을 초래한다. 폴리뉴클레오티드 또는 폴리펩티드는 다른 폴리뉴클레오티드 또는 폴리펩티드와 특정 퍼센트 "서열 유사성" 또는 "서열 동일성"을 가지며, 이는 정렬될 때 염기 또는 아미노산의 백분율이 동일하고 두 서열을 비교할 때 동일한 상대적 위치에 있음을 의미한다. 서열 유사성 (때때로 퍼센트 유사성, 퍼센트 동일성 또는 상동성으로 지칭됨)은 다수의 상이한 방식으로 결정될 수 있다. 서열 유사성을 결정하기 위해, 서열은 ncbi.nlm.nih.gov/BLAST에서의 월드 와이드 웹에서 입수가능한 BLAST를 포함하여, 당업계에 공지된 방법 및 컴퓨터 프로그램을 사용하여 정렬될 수 있다. 핵산 내 핵산 서열의 특정 스트레치 간의 퍼센트 상보성은 임의의 편리한 방법을 사용하여 결정될 수 있다. 예시적 방법은 BLAST 프로그램(베이직 로컬 정렬 검색 도구) 및 PowerBLAST 프로그램(Altschul 등, J. Mol. Biol., 1990, 215, 403-410; Zhang and Madden, Genome Res., 1997, 7, 649-656)을 포함하거나 또는 Gap 프로그램(Wisconsin Sequence Analysis Package, Version 8 for Unix, Genetics Computer Group, University Research Park, Madison Wis.)를 사용하는 것, 예를 들어 Smith와 Waterman의 알고리즘(Adv. Appl. Math., 1981, 2, 482-489)을 사용하는 기본 설정을 사용하는 것을 포함한다.
용어 "폴리펩티드" 및 "단백질"은 본 명세서에서 상호교환적으로 사용되고, 코딩된 아미노산 및 비-코딩된 아미노산, 화학적으로 또는 생화학적으로 변형되거나 유도체화된 아미노산 및 변형된 펩티드 골격을 갖는 폴리펩티드를 포함할 수 있는, 임의의 길이의 아미노산의 중합체 형태를 지칭한다. 용어는 이종성 아미노산 서열을 갖는 융합 단백질을 포함하지만 이에 제한되지 않는 융합 단백질을 포함한다.
"벡터" 또는 "발현 벡터"는, 세포에서 부착된 세그먼트의 복제 또는 발현을 일으키기 위해 다른 DNA 세그먼트, 즉 "삽입물"이 부착될 수 있는 플라스미드, 파지, 바이러스 또는 코스미드와 같은 레플리콘이다.
핵산, 폴리펩티드, 세포 또는 유기체에 적용되는 본 명세서에서 사용된 용어 "자연적으로-발생하는" 또는 "비변형된" 또는 "야생형"은 자연에서 발견되는 핵산, 폴리펩티드, 세포, 또는 유기체를 지칭한다.
본 명세서에 사용된 "돌연변이"는 야생형 또는 참조 아미노산 서열 또는 야생형 또는 참조 뉴클레오티드 서열과 비교하여 하나 이상의 아미노산 또는 뉴클레오티드의 삽입, 결실, 치환, 중복 또는 역전을 지칭한다.
본 명세서에 사용된 용어 "단리된"은 폴리뉴클레오티드, 폴리펩티드 또는 세포가 자연적으로 발생하는 환경과 상이한 환경에 있는 폴리뉴클레오티드, 폴리펩티드 또는 세포를 기술하기 위한 것으로 의미된다. 단리된 유전적으로 변형된 숙주 세포는 유전적으로 변형된 숙주 세포의 혼합된 모집단에 존재할 수 있다.
본 명세서에 사용된 "숙주 세포"는 진핵 세포, 원핵 세포 또는 단세포 엔티티로서 배양된 다세포 유기체(예를 들어, 세포주)로부터의 세포를 나타내며, 진핵 또는 원핵 세포는 핵산(예를 들어, 발현 벡터)에 대한 수용체로서 사용되고 핵산에 의해 유전적으로 변형된 원래 세포의 자손을 포함한다. 단일 세포의 자손은 자연적, 우발적 또는 고의적 돌연변이로 인해 형태나 게놈 또는 전체 DNA 보체에서 원래의 모체와 반드시 완전히 동일하지 않을 수 있음을 이해한다. "재조합 숙주 세포"("유전적으로 변형된 숙주 세포"로도 지칭됨)는 이종성 핵산, 예를 들어 발현 벡터가 그 안으로 도입된 숙주 세포이다.
본 명세서에 사용된 용어 "향성"은 특정 세포 또는 조직 유형(들) 안으로의 XDP의 우선적 도입 및/또는 특정 세포 또는 조직 유형 안으로의 도입을 용이하게 하는 세포 표면과의 우선적 상호작용을 지칭하며, 선택적으로 및 바람직하게는 XDP에 의해 세포 안으로 운반되는 서열의 발현(예를 들어, 전사 및 선택적으로 번역)이 이어진다.
본 명세서에 사용된 용어 "슈도타입" 또는 "슈도타입인"은 바람직한 특성을 보유하는 다른 바이러스의 것으로 치환된 바이러스 외피 단백질을 지칭한다. 예를 들어, HIV는 수포성 구내염 바이러스 G-단백질(VSV-G) 외피 단백질(다른 것들 중에서, 아래에 기술됨)로 슈도타입될 수 있으며, 이는 HIV 외피 단백질이 주로 CD4+ 제시 세포를 표적화하기 때문에 HIV가 더 넓은 범위의 세포를 감염시킬 수 있다.
본 명세서에 사용된 용어 "향성 인자"는 특정 세포 또는 조직 유형에 대해 향성을 제공하는 XDP의 표면 안으로 통합된 성분을 지칭한다. 향성 인자의 비-제한적 예는 당단백질, 항체 단편(예를 들어, scFv, 나노바디, 선형 항체 등), 표적 세포 마커에 대한 수용체 및 리간드를 포함한다.
"표적 세포 마커"는 향성 인자에 대한 리간드로 작용할 수 있는 표적 조직 또는 세포의 표면에 존재할 수 있는 세포-표면 수용체, 사이토카인 수용체, 항원, 종양-연관된 항원, 당단백질, 올리고뉴클레오티드, 효소 기질, 항원 결정자 또는 결합 부위를 포함하지만 이에 제한되지 않는 표적 세포에 의해 발현되는 분자를 지칭한다.
"항체 단편"은 온전한 항체의 일부를 포함하고 온전한 항체가 결합하는 항원에 결합하는 온전한 항체 이외의 분자를 지칭한다. 항체 단편의 예는 Fv, Fab, Fab', Fab'-SH, F(ab')2, 디아바디, 단일 사슬 디아바디, 선형 항체, 단일 도메인 항체, 단일 도메인 낙타류 항체, 단일-사슬 가변 단편(scFv) 항체 분자, 및 항체 단편으로부터 형성된 다중특이적 항체를 포함하지만 이에 제한되지 않는다.
용어 "보존적 아미노산 치환"은 유사한 측쇄를 갖는 아미노산 잔기의 단백질에서의 상호교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 이소류신으로 구성되며; 지방족-하이드록실 측쇄를 갖는 아미노산의 그룹은 세린 및 트레오닌으로 구성되며; 아미드-함유 측쇄를 갖는 아미노산의 그룹은 아스파라긴 및 글루타민으로 구성되며; 방향족 측쇄를 갖는 아미노산의 그룹은 페닐알라닌, 티로신 및 트립토판으로 구성되며; 염기성 측쇄를 갖는 아미노산의 그룹은 라이신, 아르기닌 및 히스티딘으로 구성되며; 황-함유 측쇄를 갖는 아미노산의 그룹은 시스테인 및 메티오닌으로 구성된다. 예시적인 보존적 아미노산 치환기는 발린-류신-이소류신, 페닐알라닌-티로신, 라이신-아르기닌, 알라닌-발린, 및 아스파라긴-글루타민이다.
본 명세서에 사용된 "치료" 또는 "치료하는"은 본 명세서에서 상호교환적으로 사용되고, 치료적 이점 및/또는 예방적 이점을 포함하지만 이에 제한되지 않는 유익한 또는 원하는 결과를 얻기 위한 접근법을 지칭한다. 치료적 이점은 치료되는 근본적인 장애 또는 질환의 근절 또는 개선을 의미한다. 치료적 이점은 대상체가 여전히 기저 장애를 앓고 있을 수 있음에도 불구하고 대상체에서 개선이 관찰되도록 하나 이상의 증상의 근절 또는 개선 또는 기저 질환과 연관된 하나 이상의 임상적 매개변수의 개선으로 달성될 수 있다.
본 명세서에 사용된 용어 "치료적으로 유효한 양" 및 "치료적으로 유효한 용량"은 인간 또는 실험 동물과 같은 대상체에게 1회 또는 반복 용량으로 투여될 때 질환 상태 또는 병태의 임의의 증상, 양상, 측정된 매개변수 또는 특성에 대한 임의의 검출가능한 유익한 효과를 가질 수 있는 단독으로 또는 조성물의 일부로서 약물 또는 생물학적 제제의 양을 지칭한다. 그러한 효과가 반드시 유익할 필요는 없다.
본 명세서에 사용된 "투여"는 화합물(예를 들어, 개시내용의 조성물) 또는 조성물(예를 들어, 약학적 조성물)의 투여량을 대상체에게 제공하는 방법을 의미한다.
"대상체"는 포유동물이다. 포유동물은 가축, 비-인간 영장류, 인간, 개, 토끼, 마우스, 랫트 및 기타 설치류를 포함하지만 이에 제한되지는 않는다.
I. 일반적인 방법
본 발명의 실행은 달리 지시되지 않는 한, 그 개시내용이 참고로 본 명세서에 포함된, Molecular Cloning: A Laboratory Manual, 3rd Ed. (Sambrook 등, Cold Spring Harbor Laboratory Press 2001); Short Protocols in Molecular Biology, 4th Ed. (Ausubel 등 eds., John Wiley & Sons 1999); Protein Methods (Bollag 등, John Wiley & Sons 1996); Nonviral Vectors for Gene Therapy (Wagner 등 eds., Academic Press 1999); Viral Vectors (Kaplift & Loewy eds., Academic Press 1995); Immunology Methods Manual (I. Lefkovits ed., Academic Press 1997); 및 Cell and Tissue Culture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, John Wiley & Sons 1998)와 같은 표준 교과서에서 찾아볼 수 있는 면역학, 생화학, 화학, 분자 생물학, 미생물학, 세포 생물학, 게놈 및 재조합 DNA의 통상적인 기술을 이용한다.
값의 범위가 제공되는 경우, 문맥이 명백하게 달리 지시하지 않는 한, 종점이 포함되고 그 범위의 상한과 하한 사이에서 하한 단위의 10분의 1까지 각각의 중간 값 및 그 명시된 범위에서 임의의 다른 명시된 또는 중간 값이 포괄된다는 것으로 이해된다. 이들 더 작은 범위의 상한 및 하한은 더 작은 범위에 독립적으로 포함될 수 있고 또한 언급된 범위에서 구체적으로 배제된 제한에 따라 포괄된다. 명시된 범위가 제한 중 하나 또는 둘 모두를 포함하는 경우, 이들 포함된 제한 중 어느 하나 또는 둘 모두를 제외한 범위도 포함된다.
달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 기술 분야에서 통상인에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 언급된 모든 간행물은 그 간행물이 인용된 것과 관련된 방법 및/또는 물질을 개시하고 기술하기 위해 참고로 본 명세서에 포함된다.
본 명세서 및 첨부된 청구범위에서 사용된, 단수 형태 "a", "an" 및 "the"는 문맥이 명백하게 달리 지시하지 않는 한 복수의 지시대상을 포함한다는 점에 유의해야 한다.
명료함을 위해 별도 실시형태의 맥락에서 기술된 개시내용의 특정 특징은 단일 실시형태에서 조합되어 제공될 수도 있다는 것을 이해할 것이다. 다른 경우에, 간결함을 위해 단일 실시형태의 맥락에서 기술되는 개시내용의 다양한 특징은 또한 별도로 또는 임의의 적절한 하위-조합으로 제공될 수 있다. 개시내용에 속하는 실시형태의 모든 조합은 본 개시내용에 의해 구체적으로 포괄되고, 마치 각각 및 모든 조합이 개별적으로 그리고 명시적으로 개시되어 있는 것처럼 본 명세서에 개시되는 것으로 의도된다. 부가하여, 다양한 실시형태 및 그 요소의 모든 하위-조합이 또한 본 개시내용에 의해 구체적으로 포괄되고, 마치 각각 및 모든 그러한 하위-조합이 개별적으로 그리고 명시적으로 본 명세서에 개시되어 있는 것처럼 본 명세서에 개시된다.
II. 표적 세포에 사용하기 위한 입자 전달 시스템
제1 양태에서, 본 개시내용은 치료 페이로드를 포함하는 입자를 자가-어셈블링하도록 설계된 입자 전달 시스템(XDP)에 관한 것으로 여기서 입자는 표적화된 세포로의 선택적 전달을 위해 설계된다. 본 명세서에 사용된 용어 "XDP"는 하나 이상의 바이러스 단백질, 폴리단백질, 바이러스로-유래된 펩티드 또는 폴리펩티드, 예컨대 비제한적으로, 캡시드, 코트, 껍질 뿐만 아니라 향성 인자 예컨대 바이러스로부터 유래된 외피 당단백질, 항체 단편, (숙주 세포에서 유래된) 지질층과 함께 표적 세포 또는 조직으로 XDP를 지향시키기 위한 향성을 위해 이용된 수용체 또는 리간드로 구성된 비-복제, 자가-어셈블리, 비-자연적으로 발생하는 다성분 구조를 지칭하며, 여기서 XDP는 숙주 세포에서 자가-어셈블리가 가능하고 치료 페이로드를 캡슐화하거나 포함할 수 있다. 본 개시내용의 XDP는 표적 세포 또는 조직에 치료 페이로드를 특이적이고 선택적으로 전달하기 위해 이용될 수 있다. 개시내용의 XDP는 질환의 치료를 위해 표적 세포 또는 기관에 선택적인 양식으로 치료제를 전달하는데 있어서의 용도를 포함하지만 이에 제한되지 않는 다양한 방법에서 유용성을 갖는다.
일부 실시형태에서, 본 개시내용은 XDP의 성분을 인코딩하는 서열을 포함하는 하나 이상의 핵산, 치료 페이로드, 및 적절한 진핵 숙주 세포 내로 도입될 때 치료 페이로드를 캡슐화하고 본 명세서에 기재된 방법 및 용도를 위해 수집 및 정제될 수 있는 XDP 입자 안으로 자가-어셈블리되는 개별 XDP 구조 성분, 처리 단백질, 치료 페이로드 및 향성 인자의 발현을 초래하는 향성 인자를 포함하는 XDP 시스템을 제공한다.
일부 실시형태에서, XDP 내에 패키징된 치료 페이로드는 하기에 보다 완전하게 기재된 치료 단백질을 포함한다. 다른 실시형태에서, XDP 내에 패키징된 치료 페이로드는 치료 핵산 또는 치료 단백질을 인코딩하는 핵산을 포함한다. 또 다른 실시형태에서, XDP는 치료 단백질 및 핵산을 포함한다. 일부 경우에, 치료 페이로드는 표적 세포에서 핵산의 편집에 유용한 CRISPR 뉴클레아제 및 가이드 RNA 또는 징크 핑거 단백질과 같은 유전자 편집 시스템을 포함한다. 일부 실시형태에서, 치료 페이로드는 클래스 2 CRISPR-Cas 시스템을 포함한다. 클래스 2 시스템은 단일 다중-도메인 이펙터 단백질을 가지고, 참고로 본 명세서에 포함된 Makarova, 등 Evolutionary classification of CRISPR-Cas systems: a burst of class 2 and derived variants. Nature Rev. Microbiol. 18:67 (2020)에 기술된, 유형 II, 유형 V 또는 유형 VI 시스템으로 더 분할된다는 점에서 클래스 1 시스템과 구별된다. 일부 실시형태에서, 뉴클레아제는 클래스 2, 유형 II CRISPR/Cas 이펙터 폴리펩티드 예컨대 Cas9를 포함한다. 다른 경우에, 뉴클레아제는 클래스 2, 유형 V CRISPR/Cas 이펙터 폴리펩티드 예컨대 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12J 및 CasX를 포함하며, 여기서 CRISPR 뉴클레아제 및 가이드 시스템은 다음 중 하나 이상을 수행할 수 있다: (i) 표적 ssDNA, dsDNA 또는 RNA를 변형(예를 들어, 편집) (예를 들어, 절단, 닉 또는 메틸화); (ii) 표적 핵산의 전사를 조절; (iii) 표적 핵산에 결합(예를 들어, 단리, 전사 차단, 라벨링 또는 영상화 등의 목적); 또는 (v) 표적 핵산과 연관된 폴리펩티드를 변형. 특정 실시형태에서, 본 개시내용은 아래에서 더 자세히 기술된, 표적 세포 내 핵산의 편집에 유용한 CasX 및 가이드 RNA 시스템(CasX:gNA 시스템)을 포함하는 리보핵산 입자(RNP)를 패키징하도록 설계된 XDP 조성물, 및 XDP 조성물을 제조하는 방법을 제공한다. 따라서, 본 개시내용은 XDP 조성물, XDP의 성분(구조적 뿐만 아니라 유전자-편집 성분 둘 모두)을 인코딩하는 핵산, 뿐만 아니라 XDP를 제조하고 사용하는 방법을 제공한다. 핵산, 조성물의 성분, 및 이들을 제조하고 사용하는 방법은 하기 본 명세서에 기재되어 있다.
a.
XDP 성분
XDP는 다양한 소스 및 다른 조합에서 유래된 성분을 활용하여 다중 형태 및 구성(예를 들어, 도 36-68 참조)으로 생성될 수 있다.
본 개시내용의 XDP의 구조적 성분은 하기에 보다 완전하게 기술되는 레트로바이러스과 바이러스 패밀리의 구성원으로부터 유래된다. 레트로바이러스의 주요 구조적 성분은 전형적으로 바이러스 프로테아제에 의한 작용에 따라 Gag를, 공급원 바이러스의 복제의 경우 그 다음 숙주 세포에서 자가-어셈블리되어 바이러스의 코어 내부 껍질을 만드는 하위 성분으로 처리하는 프로테아제 절단 부위를 함유하는 폴리단백질 Gag이다. Gag의 발현만으로도 숙주 세포에서 바이러스-유사 입자(VLP)의 어셈블리 및 방출을 매개하기에 충분하다. 모든 레트로바이러스의 Gag 단백질은 레트로바이러스 속 전체에 걸쳐 구조적으로 유사하지만 서열에서 크게 다른 N-말단 막-결합 매트릭스(MA) 도메인, 캡시드(CA) 도메인(2개의 서브도메인을 가짐) 및 뉴클레오캡시드(NC) 도메인을 함유한다. 이들 코어 도메인 외부에서 Gag 단백질은 레트로바이러스에 따라 다르고 다른 링커 및 도메인이 존재할 수 있다(Shur, F., 등 The Structure of Immature Virus-Like Rous Sarcoma Virus Gag Particles Reveals a Structural Role for the p10 Domain in Assembly. J Virol. 89(20):10294 (2015)). 숙주 세포에서 미성숙 입자로 Gag의 어셈블리 경로는 MA(Gag 폴리단백질을 원형질막으로 표적화하는 역할을 함) 사이, NC와 RNA 사이, CA 도메인(본 개시내용의 맥락에서, XDP 캡시드로 어셈블리됨) 사이의 상호작용에 의해 매개된다. 대부분의 레트로바이러스 속의 경우 어셈블리는 원형질막에서 일어나지만 베타레트로바이러스의 경우 입자가 세포질에서 어셈블리된 다음 원형질막으로 운반된다. 레트로바이러스의 맥락에서, 입자 방출과 동시에 또는 직후에 바이러스 프로테아제(PR)에 의한 Gag의 절단은 MA, CA 및 NC 단백질을 분리하여, 성숙한 바이러스 코어의 껍질을 형성하는 CA와 함께 내부 바이러스 구조의 재배열을 유도한다. 그 개개의 도메인 안으로 Gag의 완전한 단백질분해 절단은 고유 바이러스에 대한 바이러스 감염성을 위해 필요하다. 그러나, 표적 세포에 의해 흡수되고 활성 치료 페이로드를 전달할 수 있는 레트로바이러스 성분을 포함하는 숙주 세포 내의 XDP의 자가-어셈블리을 위해 XDP는 일부 구성 실시형태에서 Gag의 절단을 필요로 하지 않고; 따라서 프로테아제 및 절단 부위의 생략은 실시예를 포함하여 하기에 보다 완전하게 기재된 일부 실시형태에서 없어도 된다는 것이 발견되었다.
일부 실시형태에서, 본 개시내용은 레트로바이러스과 바이러스, 치료 페이로드(아래에서 보다 완전하게 기술됨), 및 향성 인자(아래에서 보다 완전하게 기술됨)로부터 유래된 하나 이상의 구조적 구성요소를 포함하는 XDP를 제공한다. 일부 실시형태에서, 바이러스 구조적 성분은 오르소레트로바이러스아과 바이러스로부터 유래된다. 일부 실시형태에서, 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스 또는 렌티바이러스이다. 다른 실시형태에서, 바이러스 구조적 성분은 스푸마레트로바이러스아과 바이러스로부터 유래된다. 일부 실시형태에서, 스푸마레트로바이러스아과 바이러스는 보바스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스 또는 시미스푸마바이러스이다.
b.
레트로바이러스 성분
레트로바이러스과 바이러스 패밀리는 오르소레트로바이러스아과, 스푸마레트로바이러스아과 및 미분류된 레트로바이러스과를 포함하여 상이한 서브패밀리를 갖는다. 많은 레트로바이러스는 인간, 기타 포유동물 및 새에서 심각한 질환을 야기한다. 인간 레트로바이러스는 AIDS 질환의 원인인 인간 면역결핍 바이러스 1(HIV-1) 및 HIV-2를 포함하고, 인간 T-림프영향성 바이러스(HTLV)도 또한 인간에서 질환을 야기한다. 서브패밀리 오르소레트로바이러스아과는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스 및 렌티바이러스 속을 포함한다. 조류 백혈병 바이러스 및 라우스 육종 바이러스를 포함한 알파레트로바이러스의 구성원은 야생 및 가금류의 육종, 종양 및 빈혈을 야기할 수 있다. 베타레트로바이러스의 예는 마우스 유선 종양 바이러스, 메이슨-화이자 원숭이 바이러스 및 동물성 비강 종양 바이러스를 포함한다. 델타레트로바이러스의 예는 소 백혈병 바이러스 및 인간 T-림프영양성 바이러스를 포함한다. 엡실론레트로바이러스의 구성원은 Walleye 피부 육종 바이러스, 및 Walleye 표피 증식증 바이러스 1 및 2를 포함한다. 감마레트로바이러스의 구성원은 뮤어라인 백혈병 바이러스, Maloney 뮤어라인 백혈병 바이러스, 및 고양이 백혈병 바이러스 뿐만 아니라 다른 동물 종을 감염시키는 바이러스를 포함한다. 렌티바이러스는 AIDS의 원인인 HIV-1과 HIV-2를 포함하여 만성적이고 치명적인 질환을 일으키는 레트로바이러스의 속이고, 유인원 면역결핍 바이러스를 또한 포함한다. 서브패밀리 스푸마레트로바이러스아과는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스 속을 포함한다. 레트로바이러스과의 구성원은 분자 생물학에서 가치있는 연구 도구를 제공했으며, 본 개시내용의 맥락에서 전달 시스템을 위한 XDP의 생성에 사용되었다. XDP의 레트로바이러스-유래된 구조적 성분은 레트로바이러스과의 각각의 속에서 유래될 수 있으며 생성된 XDP는 숙주 세포에서 자가-어셈블리가 가능하고 표적 세포 및 조직에 치료 페이로드의 표적화되고 선택적인 전달에서 유용성을 갖는 치료 페이로드를 캡슐화(또는 포괄)할 수 있다는 것이 발견되었다.
일부 실시형태에서, XDP 레트로바이러스 성분은 조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV)를 포함하지만 이에 제한되지 않는 알파레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); p2A 스페이서 펩티드; ap2B 스페이서 펩티드; p10 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2A, p2B, p10, 뉴클레오캡시드 폴리펩티드(NC)를 함유하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, p2A, p2B, p10, 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 비제한적으로 조류 백혈병 바이러스 및 라우스 육종 바이러스를 포함하는 알파레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 및 234로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 알파레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 알파레트로바이러스 구조 성분을 포함한다. 알파레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 위에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 마우스 유방 종양 바이러스(MMTV), 메이슨-화이자 원숭이 바이러스(MPMV) 및 동물성 비강 종양 바이러스(ENTV)를 포함하지만 이에 제한되지 않는 베타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp21/24 스페이서 펩티드; p3-p8/p12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), pp21/24, p3-p8/p12, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, pp2124 스페이서, p3-p8/p12 스페이서, 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 비제한적으로 마우스 유방 종양 바이러스, 메이슨-화이자 원숭이 바이러스, 및 동물성 비강 종양 바이러스를 포함하는 베타레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 235-257로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 베타레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 235-257로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 베타레트로바이러스 구조 성분을 포함한다. 베타레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 소 백혈병 바이러스(BLV) 및 인간 T-림프영양성 바이러스(HTLV1)를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 소 백혈병 바이러스 및 인간 T-림프영양성 바이러스를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 258-272로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 델타레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 258-272로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 델타레트로바이러스 구조 성분을 포함한다. 델타레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 Walleye 피부 육종 바이러스(WDSV), 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); p20 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p20, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, p20 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기술되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 273-277로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 엡실론레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 273-277로 구성된 군으로부터 선택된 서열에 의해 인코딩된 하나 이상의 엡실론레트로바이러스 구조 성분을 포함한다. 엡실론레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 뮤어라인 백혈병 바이러스(MLV), 말로니 뮤어라인 백혈병 바이러스(MMLV) 및 고양이 백혈병 바이러스(FLV)를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), pp12 스페이서, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, pp12, CA 및 NC), 및 선택적으로 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기술되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 278-287로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 감마레트로바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 278-287로 구성된 군으로부터 선택된 서열에 의해 인코딩되는 하나 이상의 감마레트로바이러스 구조 성분을 포함한다. 감마레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 HIV-1 및 HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드(CA), p2 스페이서 펩티드, 뉴클레오캡시드(NC), p1/p6 스페이서 펩티드; ); 매트릭스 폴리펩티드(MA), CA, p2, NC 및 p1/p6을 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, MA, CA, NC, 및 p1/p6), 및 선택적으로 절단 부위 및 프로테아제는 HIV-1, HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 288-312 및 334-339로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 렌티바이러스 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 바와 같은 서열번호: 288-312 및 334-339로 구성된 군으로부터 선택된 서열에 의해 인코딩된 하나 이상의 렌티바이러스 구조 성분을 포함한다. 렌티바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개 이상의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분은 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 그러한 경우에, 본 개시내용은 XDP를 제공하며 여기서 XDP는 p68 Gag; p3 Gag; p68 Gag 및 p3 gag를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전술한 실시형태에서, Gag 성분(예를 들어, p68 및 p3p20), 및 선택적으로 절단 부위 및 프로테아제는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 이들 성분에 대한 인코딩 서열은 표 5에 제공되고, 인코딩 플라스미드를 만들고 숙주 세포에서 XDP를 생성하는 방법은 하기 본 명세서에 기재되어 있다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 313-333으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩되는 하나 이상의 스푸마레트로바이러스아과 구조 성분을 포함한다. 일부 실시형태에서, XDP는 표 5에 제시된 서열번호: 313-333으로 구성된 군으로부터 선택된 서열에 의해 인코딩된 하나 이상의 스푸마레트로바이러스아과 구조 성분을 포함한다. 스푸마레트로바이러스 성분을 갖는 XDP는 도 36-68의 구성을 포함하는 다양한 구성으로 설계될 수 있고, 아래에 보다 자세히 기술된, 1, 2, 3 또는 4개의 핵산에 의해 인코딩될 수 있다. 일부 실시형태에서, XDP는 CasX 및 gNA를 치료 페이로드로 묘사하는 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 포함한다. 이들 대안적인 구성은 실시예에서 뿐만 아니라 아래에 보다 완전하게 기술된다. 특정 실시형태에서, 치료 페이로드는 본 명세서에 기재된 복합 CasX 및 gNA 실시형태의 RNP인 반면, 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
다른 실시형태에서, 본 개시내용은 XDP의 레트로바이러스 성분이 레트로바이러스과의 상이한 속으로부터 선택되는 XDP를 제공한다. 따라서 XDP는 매트릭스 폴리펩티드(MA), p2A 스페이서 펩티드, p2B 스페이서 펩티드; p10 스페이서 펩티드, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), pp21/24 스페이서 펩티드, p3-P8 스페이서 펩티드, pp12 스페이서 펩티드, p20 스페이서 펩티드, p1/p6 스페이서 펩티드, p68 Gag, p3 Gag, 절단 부위(들), Gag-Pol 폴리단백질; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 및 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스의 이종성 프로테아제로부터 선택된 2개 이상의 성분을 포함할 수 있으며 여기서 성분은 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 렌티바이러스, 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스로부터 유래된다.
HIV-1로부터 유래된 레트로바이러스 성분에서, 부가 단백질 인테그라제 (또는 그의 인코딩 핵산)는 XDP 시스템 뿐만 아니라, HIV 기능적 보조 유전자 vpr, vpx(HIV-2)에서 생략될 수 있으며, 이는 시험관내 바이러스 복제에 필수적이지 않다. 부가적으로, XDP 시스템의 핵산은 실시형태의 XDP 조성물의 생성을 위한 역전사효소를 필요로 하지 않는다. 따라서, 일 실시형태에서, XDP의 HIV-1 Gag-Pol 성분은, 이후에 Gag-TFR-PR로 지칭되고 아래에서 보다 완전하게 기술된, 프로테아제 절단 부위에 의해 분리된 트랜스프레임 옥타펩티드(TFP) 및 p6pol의 48개 아미노산으로 구성된 트랜스프레임 영역(TFR)에 연결된 Gag로 끝이 절단될 수 있다.
c.
프로테아제
XDP 시스템의 일부 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 레트로바이러스과의 임의의 속을 포함하는 레트로바이러스 프로테아제로부터 선택된다. 예를 들어, 프로테아제는 표 5에 제시된 서열번호: 198, 234, 239, 245, 251, 257, 261, 266, 271, 276, 282, 287, 291, 296, 301, 및 306으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 95%, 적어도 97%, 적어도 98%, 또는 적어도 99% 동일성을 갖는 서열에 의해 인코딩될 수 있다. 다른 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 턴그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제(MMP-2, -3, -7, -9, -10 및 -11 포함) 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택된 비-레트로바이러스의 이종성 프로테아제이다. 특정 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 PreScission 프로테아제; 인간 라이노바이러스(HRV) 3C 프로테아제와 글루타티온 S-트랜스퍼라제(GST)의 융합 단백질이다. 또 다른 특정 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 담배 식각 바이러스 프로테아제(TEV)이다. 또 다른 특정 실시형태에서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제이다. HIV-1 프로테아제의 경우, 전구체 Gag--Pol 폴리단백질의 99-아미노산 프로테아제(PR)(이는 Gag--Pol 전구체의 합성이 -1 프레임이동 이벤트를 초래하도록 개방 판독 프레임을 중첩함에 의해 인코딩됨)는 프로테아제 절단 부위에 의해 분리된 p6pol의 트랜스프레임 옥타펩티드(TFP) 및 48개 아미노산으로 구성된 트랜스프레임 영역(TFR)에 의해 그 N-말단에 측접된다. 프로테아제의 유리 N-말단을 방출하기 위한 p6pol-PR 부위에서의 절단은 효소적 활성의 출현 및 성숙한 프로테아제의 특징인 안정적인 3차 구조의 형성과 동시에 발생한다(Louis, JM. 등 Autoprocessing of HIV-1 protease is tightly coupled to protein folding. Nat Struct Mol Biol 6, 868-875 (1999)). 핵산이 HIV-1 Gag-Pol 폴리단백질의 전부 또는 일부를 인코딩하는 XDP 시스템의 일부 실시형태에서, Gag-Pol 서열은 -1 프레임이동 이벤트를 용이하게 하기 위해 인코딩된 TFR-PR을 포함한다. XDP 시스템이 Gag 폴리단백질로 구성된 성분 및 TFR과 프로테아제를 포함하는 pol 폴리단백질의 일부를 이용하는 일부 경우에, 성분은 본 명세서에서 "Gag-TFR-PR"로 지칭되며, 여기서 -1 프레임이동 이벤트를 용이하게 하는 능력은 인코딩된 프로테아제를 생성하는 능력과 함께 유지된다. 레트로바이러스 프로테아제를 인코딩하는 핵산의 비-제한적인 예에서, XDP 시스템 실시형태의 인코딩 플라스미드 내에 혼입될 수 있으며, 대표적인 서열이 표 5에 제공되어 있다.
프로테아제 절단 부위가 XDP 시스템에 혼입되는 상응하는 양식에서, XDP의 인코딩된 단백질 및 핵산 내의 이들의 인코딩 서열에 이용되는 프로테아제 절단 부위는 XDP 시스템에 혼입되는 프로테아제와 상관관계가 있을 것이다. 일부 실시형태에서, Gag 폴리단백질의 전부 또는 일부를 포함하는 XDP 성분의 프로테아제 절단 부위는 Gag 폴리단백질과 치료 페이로드 사이에 위치되어 XDP 입자의 성숙시, 치료 페이로드가 Gag 폴리단백질의 어떤 성분에도 묶여 있지 않도록 된다. 다른 실시형태에서, 프로테아제 절단 부위는 Gag 폴리단백질의 개별 성분 사이 뿐만 아니라 Gag 폴리단백질과 치료 페이로드 사이에 혼입된다. 프로테아제 절단 부위를 절단할 수 있는 프로테아제가 TEV인 대표적인 실시형태에서, 인코딩된 TEV 프로테아제 절단 부위는 서열 EXXYXQ(G/S)(서열번호: 17), ENLYFQG(서열번호: 18) 또는 ENLYFQS(서열번호: 19)를 가질 수 있으며, 여기서 X는 임의의 아미노산을 나타내고 TEV에 의한 절단은 Q와 G 또는 Q와 S 사이에서 발생한다. 프로테아제가 HIV-1 프로테아제인 또 다른 실시형태에서, 인코딩된 HIV-1 절단 부위는 서열 SQNYPIVQ(서열번호: 20)를 가질 수 있다. 프로테아제가 PreScission인 또 다른 실시형태에서, 프로테아제 절단 부위는 Gln 및 Gly 잔기 사이를 절단하는 코어 아미노산 서열 Leu-Phe-Gln/Gly-Pro(서열번호: 1010)를 포함한다. 일 실시형태에서, 절단 부위를 포함하는 XDP는 동일한 프로테아제 절단 부위를 갖는다. 또 다른 실시형태에서, 절단 부위를 포함하는 XDP는 상이한 프로테아제 절단 부위를 가지고 상이한 프로테아제에 대한 기질이다. 또 다른 실시형태에서, XDP 시스템은 2개의 상이한 프로테아제; 예를 들어, HIV-1 및 PreScission 프로테아제에 의한 절단에 민감한 절단 서열을 포함할 수 있다. 그러한 경우에, XDP를 인코딩하는 핵산은 양 프로테아제 모두에 대한 인코딩 서열을 포함할 것이다.
추가적인 프로테아제 절단 부위는 본 발명의 XDP의 범주 내인 것으로 예상되고, 특히 서열번호: 874-897, 및 934-946을 포함한다.
d.
XDP 시스템의 단백질 및 핵산 치료 페이로드
본 개시내용의 XDP에 포함하기에 적합한 단백질 치료 페이로드는 사이토카인(예를 들어, IFN α, β, 및 γ, TNF-α, G-CSF, GM-CSF)), 인터루킨(예를 들어, IL-1에서 IL-40), 성장 인자(예를 들어, VEGF, PDGF, IGF-1, EGF 및 TGF-β), 효소, 수용체, 마이크로단백질, 호르몬(예를 들어, 성장 호르몬, 인슐린), 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자(예를 들어, FVII, FVIII, FIX, FX), 항응고제, 골형성 단백질, 조작된 단백질 스캐폴드, 혈전용해제(예를 들어, 스트렙토키나제, 조직 플라스미노겐 활성화제, 플라스미노겐, 및 플라스미드), CRISPR 단백질(클래스 1 및 클래스 2 유형 II, 유형 V 또는 유형 VI) 뿐만 아니라 조작된 단백질 예컨대 신경계, 대사, 심혈관, 간, 신장 또는 내분비 질환 및 장애와 같은 질환을 치료하기 위한 항암 요법 또는 생물학적제제를 포함하지만 이에 제한되지 않는 다양한 범주의 단백질-기반 치료제를 포함한다. 본 개시내용의 XDP에 포함하기에 적합한 핵산 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 유전자 요법에 이용되는 핵산(예를 들어, CRISPR 시스템 및 공여자 템플릿에 이용되는 가이드 RNA), 마이크로 RNA, 리보자임, RNA 유인체 및 원형 RNA 뿐만 아니라 전술한 단백질 치료 페이로드를 인코딩하는 서열을 포함하는, 다양한 범주를 포함한다. 특정 실시형태에서, XDP의 단백질 페이로드는 표 1, 7, 8, 9 및 11에 제시된 바와 같은 서열번호: 21-233, 343-345, 350-353, 355-367 및 388-397의 CasX 변이체를 포함하는 본 명세서에 기재된 임의의 실시형태의 CasX 변이체 단백질을 포함하는 반면 핵산 페이로드는 표 3에 제시된 바와 같은 서열번호: 597-781의 스캐폴드 서열을 갖는 gNA 변이체를 포함하는, 본 명세서에 기재된 임의의 실시형태의 하나 이상의 가이드 RNA 및 선택적으로 공여자 템플릿을 포함한다.
e.
XDP 시스템의 CRISPR 단백질
일부 실시형태에서, 본 개시내용은 진핵 세포의 게놈 편집에 유용성을 갖는 표적 핵산에 결합하도록 조작된 하나 이상의 가이드 핵산 및 CRISPR 뉴클레아제를 포함하는 XDP 조성물 및 시스템을 제공한다. 일부 실시형태에서, XDP 시스템에 이용된 CRISPR 뉴클레아제는 클래스 2 뉴클레아제이다. 다른 실시형태에서, CRISPR 뉴클레아제는 클래스 2, 유형 V 뉴클레아제이다. 클래스 2, 유형 V CRISPR-Cas 시스템의 구성원은 차이점이 있지만, Cas9 시스템과 구별되는 몇 가지 공통된 특성을 공유한다. 첫째, 유형 V 뉴클레아제는 단일 RNA-가이드된 RuvC 도메인-함유 이펙터를 보유하지만 HNH 도메인이 없고, 이들은 표적 서열의 3' 측에서 G-풍부 PAM에 의존하는 Cas9 시스템과 상이한, 비-표적화된 가닥 상의 표적 영역에 대해 T-풍부 PAM 5' 업스트림에서 인식한다. 유형 V 뉴클레아제는 PAM에 가까운 근위 부위에서 무딘 말단을 생성하는 Cas9와 달리 PAM 서열에 원위에서 엇갈린 이중-가닥 파손을 생성한다. 부가하여, 유형 V 뉴클레아제는 시스에서 표적 dsDNA 또는 ssDNA 결합에 의해 활성화될 때 트랜스에서 ssDNA를 분해한다. 일부 실시형태에서, XDP 실시형태에서 이용되는 유형 V 뉴클레아제는 5' TC PAM 모티프를 인식하고 RuvC 도메인에 의해서만 절단된 엇갈린 말단을 생성한다. 일부 실시형태에서, XDP는 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택되는 클래스 2, 유형 V 뉴클레아제를 포함한다. 특정 실시형태에서, 본 개시내용은 진핵 세포에서 표적 핵산 서열을 변형하도록 특이적으로 설계된 하나 이상의 가이드 핵산(gNA) 및 복합화된 CasX 단백질의 리보핵단백질(RNP)을 포함하는 XDP를 제공한다.
본 명세서에 사용된 용어 "CasX 단백질"은 단백질의 패밀리를 지칭하고, 모든 자연적으로 발생하는 CasX 단백질(또한 본 명세서에서 "야생형" 또는 "참조" CasX로 지칭됨), 뿐만 아니라 자연적으로-발생하는 참조 CasX 단백질에 비해 적어도 하나의 도메인에서 하나 이상의 변형이 있는 CasX 변이체를 포괄한다. 참조 CasX 단백질은 (본 명세서에 참조로 포함된, US20180346927A1 및 WO2018064371A1에 기술된 바와 같이) 델타프로테오박테리아, 플랑크토마이세테스 또는 칸디다투스로부터 단리되거나 유도된 것을 포함하지만 이에 제한되지 않는다. 개시내용의 범주 내에 있는 것으로 고려되는 CasX 변이체의 예시적인 실시형태는 하기 본 명세서에 기재되어 있다.
일부 경우에, 유형 V 참조 CasX 단백질이 델타프로테오박테리아로부터 단리되거나 유도된다. 일부 실시형태에서, CasX 단백질은 다음의 서열에 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다:
1 MEKRINKIRK KLSADNATKP VSRSGPMKTL LVRVMTDDLK KRLEKRRKKP EVMPQVISNN
61 AANNLRMLLD DYTKMKEAIL QVYWQEFKDD HVGLMCKFAQ PASKKIDQNK LKPEMDEKGN
121 LTTAGFACSQ CGQPLFVYKL EQVSEKGKAY TNYFGRCNVA EHEKLILLAQ LKPEKDSDEA
181 VTYSLGKFGQ RALDFYSIHV TKESTHPVKP LAQIAGNRYA SGPVGKALSD ACMGTIASFL
241 SKYQDIIIEH QKVVKGNQKR LESLRELAGK ENLEYPSVTL PPQPHTKEGV DAYNEVIARV
301 RMWVNLNLWQ KLKLSRDDAK PLLRLKGFPS FPVVERRENE VDWWNTINEV KKLIDAKRDM
361 GRVFWSGVTA EKRNTILEGY NYLPNENDHK KREGSLENPK KPAKRQFGDL LLYLEKKYAG
421 DWGKVFDEAW ERIDKKIAGL TSHIEREEAR NAEDAQSKAV LTDWLRAKAS FVLERLKEMD
481 EKEFYACEIQ LQKWYGDLRG NPFAVEAENR VVDISGFSIG SDGHSIQYRN LLAWKYLENG
541 KREFYLLMNY GKKGRIRFTD GTDIKKSGKW QGLLYGGGKA KVIDLTFDPD DEQLIILPLA
601 FGTRQGREFI WNDLLSLETG LIKLANGRVI EKTIYNKKIG RDEPALFVAL TFERREVVDP
661 SNIKPVNLIG VDRGENIPAV IALTDPEGCP LPEFKDSSGG PTDILRIGEG YKEKQRAIQA
721 AKEVEQRRAG GYSRKFASKS RNLADDMVRN SARDLFYHAV THDAVLVFEN LSRGFGRQGK
781 RTFMTERQYT KMEDWLTAKL AYEGLTSKTY LSKTLAQYTS KTCSNCGFTI TTADYDGMLV
841 RLKKTSDGWA TTLNNKELKA EGQITYYNRY KRQTVEKELS AELDRLSEES GNNDISKWTK
901 GRRDEALFLL KKRFSHRPVQ EQFVCLDCGH EVHADEQAAL NIARSWLFLN SNSTEFKSYK
961 SGKQPFVGAW QAFYKRRLKE VWKPNA (서열번호: 1).
어떤 경우에, 유형 V 참조 CasX 단백질이 플랑크토마이세테스로부터 단리되거나 유도된다. 일부 실시형태에서, CasX 단백질은 다음의 서열에 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다:
1 MQEIKRINKI RRRLVKDSNT KKAGKTGPMK TLLVRVMTPD LRERLENLRK KPENIPQPIS
61 NTSRANLNKL LTDYTEMKKA ILHVYWEEFQ KDPVGLMSRV AQPAPKNIDQ RKLIPVKDGN
121 ERLTSSGFAC SQCCQPLYVY KLEQVNDKGK PHTNYFGRCN VSEHERLILL SPHKPEANDE
181 LVTYSLGKFG QRALDFYSIH VTRESNHPVK PLEQIGGNSC ASGPVGKALS DACMGAVASF
241 LTKYQDIILE HQKVIKKNEK RLANLKDIAS ANGLAFPKIT LPPQPHTKEG IEAYNNVVAQ
301 IVIWVNLNLW QKLKIGRDEA KPLQRLKGFP SFPLVERQAN EVDWWDMVCN VKKLINEKKE
361 DGKVFWQNLA GYKRQEALLP YLSSEEDRKK GKKFARYQFG DLLLHLEKKH GEDWGKVYDE
421 AWERIDKKVE GLSKHIKLEE ERRSEDAQSK AALTDWLRAK ASFVIEGLKE ADKDEFCRCE
481 LKLQKWYGDL RGKPFAIEAE NSILDISGFS KQYNCAFIWQ KDGVKKLNLY LIINYFKGGK
541 LRFKKIKPEA FEANRFYTVI NKKSGEIVPM EVNFNFDDPN LIILPLAFGK RQGREFIWND
601 LLSLETGSLK LANGRVIEKT LYNRRTRQDE PALFVALTFE RREVLDSSNI KPMNLIGIDR
661 GENIPAVIAL TDPEGCPLSR FKDSLGNPTH ILRIGESYKE KQRTIQAAKE VEQRRAGGYS
721 RKYASKAKNL ADDMVRNTAR DLLYYAVTQD AMLIFENLSR GFGRQGKRTF MAERQYTRME
781 DWLTAKLAYE GLPSKTYLSK TLAQYTSKTC SNCGFTITSA DYDRVLEKLK KTATGWMTTI
841 NGKELKVEGQ ITYYNRYKRQ NVVKDLSVEL DRLSEESVNN DISSWTKGRS GEALSLLKKR
901 FSHRPVQEKF VCLNCGFETH ADEQAALNIA RSWLFLRSQE YKKYQTNKTT GNTDKRAFVE
961 TWQSFYRKKL KEVWKPAV (서열번호: 2).
어떤 경우에, 유형 V 참조 CasX 단백질이 칸디다투스 성박테리아로부터 단리되거나 유도된다. 일부 실시형태에서, CasX 단백질은 다음의 서열에 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다
1 MDNANKPSTK SLVNTTRISD HFGVTPGQVT RVFSFGIIPT KRQYAIIERW FAAVEAARER
61 LYGMLYAHFQ ENPPAYLKEK FSYETFFKGR PVLNGLRDID PTIMTSAVFT ALRHKAEGAM
121 AAFHTNHRRL FEEARKKMRE YAECLKANEA LLRGAADIDW DKIVNALRTR LNTCLAPEYD
181 AVIADFGALC AFRALIAETN ALKGAYNHAL NQMLPALVKV DEPEEAEESP RLRFFNGRIN
241 DLPKFPVAER ETPPDTETII RQLEDMARVI PDTAEILGYI HRIRHKAARR KPGSAVPLPQ
301 RVALYCAIRM ERNPEEDPST VAGHFLGEID RVCEKRRQGL VRTPFDSQIR ARYMDIISFR
361 ATLAHPDRWT EIQFLRSNAA SRRVRAETIS APFEGFSWTS NRTNPAPQYG MALAKDANAP
421 ADAPELCICL SPSSAAFSVR EKGGDLIYMR PTGGRRGKDN PGKEITWVPG SFDEYPASGV
481 ALKLRLYFGR SQARRMLTNK TWGLLSDNPR VFAANAELVG KKRNPQDRWK LFFHMVISGP
541 PPVEYLDFSS DVRSRARTVI GINRGEVNPL AYAVVSVEDG QVLEEGLLGK KEYIDQLIET
601 RRRISEYQSR EQTPPRDLRQ RVRHLQDTVL GSARAKIHSL IAFWKGILAI ERLDDQFHGR
661 EQKIIPKKTY LANKTGFMNA LSFSGAVRVD KKGNPWGGMI EIYPGGISRT CTQCGTVWLA
721 RRPKNPGHRD AMVVIPDIVD DAAATGFDNV DCDAGTVDYG ELFTLSREWV RLTPRYSRVM
781 RGTLGDLERA IRQGDDRKSR QMLELALEPQ PQWGQFFCHR CGFNGQSDVL AATNLARRAI
841 SLIRRLPDTD TPPTP (서열번호: 3).
XDP 시스템의 일부 실시형태에서, 개시내용은 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질의 서열에 비하여 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 20, 적어도 30, 적어도 40 또는 적어도 50 이상의 개별적 또는 순차적 돌연변이를 갖는 서열을 포함하는 XDP에서 사용하기 위한 CasX 변이체 단백질을 제공한다. 이들 돌연변이는 삽입, 결실, 아미노산 치환 또는 이의 임의의 조합일 수 있다. 일부 실시형태에서, 전술한 돌연변이에 부가하여, CasX 변이체는 이종성 참조 CasX로부터 도메인의 일부 또는 전부의 치환을 추가로 포함할 수 있고, 치환된 도메인은 하나 이상의 돌연변이를 추가로 포함할 수 있다. 개시내용의 CasX 변이체 단백질을 생성하기 위한 적합한 돌연변이유발 방법은, 예를 들어, 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 오류 경향있는 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 엊갈린 확장 PCR, 유전자 셔플링 또는 도메인 스와핑을 포함할 수 있다. 일부 실시형태에서, CasX 변이체는, 예를 들어, 참조 CasX에서 하나 이상의 원하는 돌연변이를 선택함에 의해 설계된다. 임의의 아미노산은 본 명세서에 기재된 치환에서 임의의 다른 아미노산으로 치환될 수 있다. 치환은 보존적 치환일 수 있다(예를 들어, 염기성 아미노산이 다른 염기성 아미노산으로 치환됨). 치환은 비-보존적 치환일 수 있다(예를 들어, 염기성 아미노산이 산성 아미노산으로 치환되거나 또는 그 반대임). 예를 들어, 참조 CasX 단백질에서 프롤린은 본 개시내용의 CasX 변이체 단백질을 생성하기 위해 아르기닌, 히스티딘, 라이신, 아스파르트산, 글루탐산, 세린, 트레오닌, 아스파라긴, 글루타민, 시스테인, 글리신, 알라닌, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판, 티로신 또는 발린 중 임의의 것으로 치환될 수 있다. 특정 실시형태에서, 참조 CasX 단백질의 활성은 하나 이상의 CasX 변이체의 활성을 비교하여, 이에 의해 CasX 변이체의 기능에서 개선을 측정하는 벤치마크로서 사용된다.
일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 적어도 하나의 아미노산 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 1-4개 아미노산, 1-10개 아미노산, 1-20개 아미노산, 1-30개 아미노산, 1-40개 아미노산, 1-50개 아미노산, 1-60개 아미노산, 1-70개 아미노산, 1-80개 아미노산, 1-90개 아미노산, 1-100개 아미노산, 2-10개 아미노산, 2-20개 아미노산, 2-30개 아미노산, 3-10개 아미노산 산, 3-20개 아미노산, 3-30개 아미노산, 4-10개 아미노산, 4-20개 아미노산, 3-300개 아미노산, 5-10개 아미노산, 5-20개 아미노산, 5-30개 아미노산, 10-50개 아미노산 또는 20-50개 아미노산의 결실을 포함한다. 일부 실시형태에서, CasX 단백질은 참조 CasX 단백질에 비해 적어도 약 100개 연속적인 아미노산의 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 30, 40, 50 또는 100개 연속적인 아미노산의 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 연속적인 아미노산의 결실을 포함한다.
일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 2개 이상의 결실을 포함하고, 2개 이상의 결실은 연속적인 아미노산이 아니다. 예를 들어, 제1 결실은 참조 CasX 단백질의 제1 도메인에 있을 수 있고 제2 결실은 참조 CasX 단백질의 제2 도메인에 있을 수 있다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 비-연속적인 결실을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 적어도 20개 비-연속적인 결실을 포함한다. 각각의 비-연속적인 결실은 본 명세서에 기재된 임의의 길이의 아미노산, 예를 들어 1-4개 아미노산, 1-10개 아미노산 등일 수 있다.
일부 실시형태에서, CasX 변이체 단백질은 서열번호: 1, 2, 또는 3의 서열에 비해 하나 이상의 아미노산 삽입을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질에 비해 1개 아미노산의 삽입, 2-3개 연속적인 또는 비-연속적인 아미노산, 2-4개 연속적인 또는 비-연속적인 아미노산, 2-5개 연속적인 또는 비-연속적인 아미노산, 2-6개 연속적인 또는 비-연속적인 아미노산, 2-7개 연속적인 또는 비-연속적인 아미노산, 2-8개 연속적인 또는 비-연속적인 아미노산, 2-9개 연속적인 또는 비-연속적인 아미노산, 2-10개 연속적인 또는 비-연속적인 아미노산, 2-20개 연속적인 또는 비-연속적인 아미노산 산, 2-30개 연속적인 또는 비-연속적인 아미노산, 2-40개 연속적인 또는 비-연속적인 아미노산, 2-50개 연속적인 또는 비-연속적인 아미노산, 2-60개 연속적인 또는 비-연속적인 아미노산, 2-70개 연속적인 또는 비-연속적인 아미노산, 2-80개 연속적인 또는 비-연속적인 아미노산, 2-90개 연속적인 또는 비-연속적인 아미노산, 2-100개 연속적인 또는 비-연속적인 아미노산, 3-10개 연속적인 또는 비-연속적인 아미노산, 3-20개 연속적인 또는 비-연속적인 아미노산, 3-30개 연속적인 또는 비-연속적인 아미노산, 4-10개 연속적인 또는 비-연속적인 아미노산, 4-20개 연속적인 또는 비-연속적인 아미노산, 3-300개 연속적인 또는 비-연속적인 아미노산, 5-10개 연속적인 또는 비-연속적인 아미노산, 5-20개 연속적인 또는 비-연속적인 아미노산, 5-30개 연속적인 또는 비-연속적인 아미노산, 10-50 연속적인 또는 비-연속적인 아미노산 또는 20-50 연속적인 또는 비-연속적인 아미노산의 삽입을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 연속적인 또는 비-연속적인 아미노산의 삽입을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 적어도 약 100개 연속적인 또는 비-연속적인 아미노산의 삽입을 포함한다. 임의의 아미노산, 또는 아미노산의 조합이 본 명세서에 기재된 삽입에서 삽입되어 CasX 변이체 단백질을 생성할 수 있다.
본 명세서에 기재된 치환, 삽입 및 결실 실시형태의 임의의 순열을 조합하여 개시내용의 CasX 변이체 단백질을 생성할 수 있다. 예를 들어, CasX 변이체 단백질은 참조 CasX 단백질 서열에 비해 적어도 하나의 치환 및 적어도 하나의 결실, 참조 CasX 단백질 서열에 비해 적어도 하나의 치환 및 적어도 하나의 삽입, 참조 CasX 단백질 서열에 비해 적어도 하나의 삽입 및 적어도 하나의 결실, 또는 참조 CasX 단백질 서열에 비해 적어도 하나의 치환, 하나의 삽입 및 하나의 결실을 포함할 수 있다.
CasX 변이체는 다음의 도메인: 비-표적 가닥 결합(NTSB) 도메인, 표적 가닥 장입(TSL) 도메인, 나선형 I 도메인, 나선형 II 도메인, 올리고뉴클레오티드 결합 도메인(OBD), 및 RuvC DNA 절단 도메인(촉매적으로 사멸된 CasX 변이체에서 결실될 수 있는 후자) 중 일부 또는 전부를 포함하며, 아래에서 보다 완전하게 기술된다. 일부 실시형태에서, CasX 변이체 단백질의 적어도 하나의 변형은 서열번호: 1-3의 서열을 포함하는 참조 CasX 단백질의 한 도메인의 적어도 일부의 결실을 포함한다. 일부 실시형태에서, 결실은 NTSBD, TSLD, 나선형 I 도메인, 나선형 II 도메인, OBD 또는 RuvC DNA 절단 도메인에 있다. 일부 실시형태에서, CasX 변이체는 NTSB 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, CasX 변이체는 TSL 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, TSL 도메인에서 적어도 하나의 변형은 서열번호: 2의 아미노산 Y857, S890, 또는 S932 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 나선형 I 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, 나선형 I 도메인의 적어도 하나의 변형은 서열번호: 2의 아미노산 S219, L249, E259, Q252, E292, L307, 또는 D318 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 나선형 II 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, 나선형 II 도메인에서 적어도 하나의 변형은 서열번호 :2의 아미노산 D361, L379, E385, E386, D387, F399, L404, R458, C477, 또는 D489 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 OBD 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, OBD에서 적어도 하나의 변형은 서열번호: 2의 아미노산 F536, E552, T620, 또는 I658 중 하나 이상의 아미노산 치환을 포함한다. 일부 실시형태에서, CasX 변이체는 RuvC DNA 절단 도메인에 적어도 하나의 변형을 포함한다. 일부 실시형태에서, RuvC DNA 절단 도메인에서 적어도 하나의 변형은 서열번호:2의 아미노산 K682, G695, A708, V711, D732, A739, D733, L742, V747, F755, M771, M779, W782, A788, G791, L792, P793, Y797, M799, Q804, S819, 또는 Y857 중 하나 이상의 아미노산 치환 또는 아미노산 P793의 결실을 포함한다.
일부 실시형태에서, CasX 변이체는 참조 CasX 단백질에 비해: (a) L379R의 아미노산 치환; (b) A708K의 아미노산 치환; (c) T620P의 아미노산 치환; (d) E385P의 아미노산 치환; (e) Y857R의 아미노산 치환; (f) I658V의 아미노산 치환; (g) F399L의 아미노산 치환; (h) Q252K의 아미노산 치환; (i) L404K의 아미노산 치환; 및 (j) P793의 아미노산 결실 중 하나 이상으로부터 선택된 서열번호:2의 적어도 하나의 변형을 포함한다.
개시내용의 CasX 변이체 단백질은 참조 CasX 단백질 및 참조 gNA의 RNP와 비교하여, TTC, ATC, GTC, 또는 CTC로부터 선택된 PAM 서열을 포함하는, PAM TC 모티프를 이용하여, RNP로서 gNA와 복합체를 형성할 때 표적 DNA를 효율적으로 편집 및/또는 결합하는 고양된 능력을 갖는다. 전기한 것에서, PAM 서열은 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP의 편집 효율 및/또는 결합에 비하여 검정 시스템에서 gNA의 표적화 서열과 동일성을 갖는 프로토스페이서의 비-표적 가닥에 대해 적어도 1 뉴클레오티드 5'에 위치된다. 일 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 TTC이다. 또 다른 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 ATC이다. 또 다른 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 CTC이다. 또 다른 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 검정 시스템에서 참조 CasX 단백질 및 참조 gNA를 포함하는 RNP에 비하여 표적 DNA에서 표적 서열의 더 큰 편집 효율 및/또는 결합을 나타내며, 여기서 표적 DNA의 PAM 서열은 GTC이다. 전기한 실시형태에서, 하나 이상의 PAM 서열에 대한 증가된 편집 효율 및/또는 결합 친화도는 PAM 서열에 대한 서열번호:1-3의 CasX 단백질 및 표 2의 gNA 중 임의의 하나의 RNP의 편집 효율 및/또는 결합 친화도와 비교하여 적어도 1.5-배 이상 더 크다.
본 명세서에 기재된 참조 CasX 단백질과 비교할 때 CasX 변이체 단백질의 하나 이상의 기능 또는 특성을 개선하는 모든 변이체는 개시내용의 범주 내에 있는 것으로 예상된다. CasX 변이체 실시형태의 예시적인 개선된 특성은, 아래에 더 자세히 기술된 바와 같은, 변이체의 개선된 폴딩, gNA에 대한 개선된 결합 친화성, 표적 핵산에 대한 개선된 결합 친화성, 표적 DNA의 편집 및/또는 결합에서 더 큰 스펙트럼의 PAM 서열을 활용하는 개선된 능력, 표적 DNA의 개선된 풀림, 증가된 편집 활성, 개선된 편집 효율, 개선된 편집 특이성, 효율적으로 편집될 수 있는 진핵생물 게놈의 증가된 백분율, 증가된 뉴클레아제의 활성, 이중 가닥 절단에 대한 증가된 표적 가닥 장입, 단일 가닥 닉킹에 대한 감소된 표적 가닥 장입, 감소된 표적-외 절단, DNA의 비-표적 가닥의 개선된 결합, 개선된 단백질 안정성, 개선된 단백질:gNA(RNP) 복합체 안정성, 개선된 단백질 용해도, 개선된 단백질:gNA(RNP) 복합체 용해도, 개선된 단백질 수율, 개선된 단백질 발현, 및 개선된 융합 특성을 포함하지만 이에 제한되지는 않는다. 일부 실시형태에서, CasX 변이체 및 gNA 변이체의 RNP는 비교가능한 양식으로 검정될 때 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2의 gNA의 RNP에 비해 적어도 약 1.1 내지 약 100,000-배 개선된 하나 이상의 개선된 특성을 나타낸다. 다른 경우에, CasX 변이체 및 gNA 변이체의 RNP의 하나 이상의 개선된 특성은 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2의 gNA의 RNP에 비해 적어도 약 1.1, 적어도 약 10, 적어도 약 100, 적어도 약 1000, 적어도 약 10,000, 적어도 약 100,000-배 이상 개선되었다. 다른 경우에, CasX 변이체 및 gNA 변이체의 RNP의 하나 이상의 개선된 특성은 비교가능한 양식으로 검정될 때 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2에 제시된 서열번호: 4-16의 참조 gNA의 RNP에 비해 약 1.1 내지 100,00-배, 약 1.1 내지 10,00-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,00-배, 약 100 내지 10,00-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,00-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 개선된다. 다른 경우에, CasX 변이체 및 gNA 변이체의 RNP의 하나 이상의 개선된 특성은 비교가능한 양식으로 검정될 때 서열번호:1, 서열번호:2, 또는 서열번호:3의 참조 CasX 단백질 및 표 2에 제시된 서열번호: 4-16 gNA의 RNP에 비해 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배, 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 개선된다. 예시적인 개선된 특성은 개선된 편집 효율을 포함한다. 일부 실시형태에서, 20pM 이하의 농도에서 개시내용의 CasX 변이체 단백질 및 gNA를 포함하는 RNP는 적어도 80%의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 일부 실시형태에서, 20pM 이하 농도의 RNP는 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. 일부 실시형태에서, 50pM 이하, 40pM 이하, 30pM 이하, 20pM 이하, 10pM 이하, 또는 5pM 이하 농도에서 RNP는 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95%의 효율로 이중 가닥 DNA 표적을 절단할 수 있다. CasX 변이체의 개선된 편집 효율은 개시내용의 gNA와 함께 개시내용의 XDP에 함입을 매우-적합하게 한다.
용어 "CasX 변이체"는 융합 단백질인 변이체를 포함하고; 즉, CasX는 이종성 서열에 "융합"된다. 이것은 CasX 변이체 서열 및 이종성 단백질 또는 이의 도메인에 대한 CasX의 N-말단, C-말단 또는 내부 융합을 포함하는 CasX 변이체를 포함한다.
일부 실시형태에서, CasX 변이체 단백질은 400 내지 2000개 아미노산, 500 내지 1500개 아미노산, 700 내지 1200개 아미노산, 800 내지 1100개 아미노산 또는 900 내지 1000개 아미노산을 포함한다.
일부 실시형태에서, CasX 변이체 단백질은 gNA:표적 DNA 복합체화가 발생하는 채널을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 gNA와 결합하는 계면을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, 참조 CasX 단백질의 일부 실시형태에서, 나선형 I, 나선형 II 및 OBD 도메인은 모두 gNA:표적 DNA 복합체와 접촉하거나 이에 근접하고, 이들 도메인 중 임의의 것 내의 비-인접 잔기에 대한 하나 이상의 변형이 CasX 변이체 단백질의 기능을 향상시킬 수 있다.
일부 실시형태에서, CasX 변이체 단백질은 비-표적 가닥 DNA와 결합하는 채널을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, CasX 변이체 단백질은 NTSBD의 비-인접 잔기에 대한 하나 이상의 변형을 포함할 수 있다. 일부 실시형태에서, CasX 변이체 단백질은 PAM과 결합하는 계면을 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 예를 들어, CasX 변이체 단백질은 나선형 I 도메인 또는 OBD의 비-인접 잔기에 대한 하나 이상의 변형을 포함할 수 있다. 일부 실시형태에서, CasX 변이체 단백질은 비-인접 표면-노출된 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 본 명세서에 사용된 바와 같이, "표면-노출된 잔기"는 CasX 단백질의 표면 상의 아미노산, 또는 골격 또는 측쇄의 일부와 같은 아미노산의 적어도 일부가 단백질의 표면 상에 있는 아미노산을 지칭한다. 수성 세포내 환경에 노출되는 CasX와 같은 세포 단백질의 표면 노출된 잔기는 빈번하게 양으로 하전된 친수성 아미노산, 예를 들어 아르기닌, 아스파라긴, 아스파르테이트, 글루타민, 글루타메이트, 히스티딘, 라이신, 세린 및 트레오닌으로부터 선택된다. 따라서, 예를 들어, 본 명세서에 제공된 변이체의 일부 실시형태에서, 표면 노출된 잔기의 영역은 참조 CasX 단백질과 비교하여 하나 이상의 삽입, 결실 또는 치환을 포함한다. 일부 실시형태에서, 하나 이상의 양으로 하전된 잔기는 하나 이상의 다른 양으로 하전된 잔기, 또는 음으로 하전된 잔기, 또는 비하전된 잔기, 또는 이의 임의의 조합으로 치환된다. 일부 실시형태에서, 치환을 위한 하나 이상의 아미노산 잔기는 근접 결합된 핵산이고, 예를 들어 표적 DNA와 접촉하는 RuvC 도메인 또는 나선형 I 도메인에서의 잔기, 또는 gNA에 결합하는 OBD 또는 나선형 II 도메인에서의 잔기는 하나 이상의 양으로 하전된 또는 극성 아미노산으로 치환될 수 있다.
일부 실시형태에서, CasX 변이체 단백질은 참조 CasX 단백질의 도메인에서 소수성 패킹을 통해 코어를 형성하는 비-인접 잔기의 영역을 포함하는 하나 이상의 변형을 포함한다. 어떠한 이론에도 얽매이지 않고 소수성 패킹을 통해 코어를 형성하는 영역은 발린, 이소류신, 류신, 메티오닌, 페닐알라닌, 트립토판 및 시스테인과 같은 소수성 아미노산에 풍부하다. 예를 들어, 일부 참조 CasX 단백질에서 RuvC 도메인은 활성 부위에 인접한 소수성 포켓을 포함한다. 일부 실시형태에서, 영역의 2 내지 15개 잔기는 하전된 극성 또는 염기-적층이다. 하전된 아미노산(본 명세서에서는 때때로 잔기로 지칭됨)은 예를 들어 아르기닌, 라이신, 아스파르트산 및 글루탐산을 포함할 수 있고, 이들 아미노산의 측쇄는 가교 파트너가 또한 존재한다면 염 가교를 형성할 수 있다. 극성 아미노산은 예를 들어 글루타민, 아스파라긴, 히스티딘, 세린, 트레오닌, 티로신 및 시스테인을 포함할 수 있다. 일부 실시형태에서 극성 아미노산은 그 측쇄의 정체성에 따라 양성자 공여체 또는 수용체로서 수소 결합을 형성할 수 있다. 본 명세서에 사용된 "염기-적층"은 아미노산 잔기(예컨대 트립토판, 티로신, 페닐알라닌, 또는 히스티딘)의 방향족 측쇄와 핵산 내의 적층된 뉴클레오티드 염기의 상호작용을 포함한다. CasX 변이체 단백질의 기능적 부분을 형성하기 위해 매우 공간적으로 근접한 비-인접 아미노산의 영역에 대한 임의의 변형은 개시내용의 범주 내인 것으로 고려된다.
f.
다중 공급원 단백질로부터의 도메인을 갖는 CasX 변이체 단백질
본 명세서에 기재된 바와 같은 2개 이상의 상이한 CasX 단백질, 예컨대 2개 이상의 자연적으로 발생하는 CasX 단백질, 또는 2개 이상의 CasX 변이체 단백질 서열로부터의 단백질 도메인을 포함하는 키메라 CasX 단백질을 포함하는 XDP가 또한 개시내용의 범주 내에서 고려된다. 본 명세서에 사용된 "키메라 CasX 단백질"은 일부 실시형태에서 상이한 종으로부터 단리될 수 있는 2개의 자연적으로 발생하는 단백질과 같은 상이한 공급원으로부터 단리되거나 유래된 적어도 2개의 도메인을 함유하는 CasX를 지칭한다. 예를 들어, 일부 실시형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터 제1 도메인 및 상이한 제2 CasX 단백질로부터 제2 도메인을 포함한다. 일부 실시형태에서, 제1 도메인은 NTSB, TSL, 나선형 I, 나선형 II, OBD 및 RuvC 도메인으로 구성된 군으로부터 선택될 수 있다. 일부 실시형태에서, 제2 도메인은 전기한 제1 도메인과 상이한 제2 도메인을 갖는 NTSB, TSL, 나선형 I, 나선형 II, OBD 및 RuvC 도메인으로 구성된 군으로부터 선택된다. 예를 들어, 키메라 CasX 단백질은 서열번호: 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 I, 나선형 II, OBD 도메인, 및 서열번호: 1의 CasX 단백질로부터의 RuvC 도메인을 포함할 수 있거나, 또는 그 반대일 수 있다. 추가 예로서, 키메라 CasX 단백질은 서열번호: 2의 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD 및 RuvC 도메인, 및 서열번호: 1의 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있거나, 또는 그 반대일 수 있다. 따라서, 특정 실시형태에서, 키메라 CasX 단백질은 제1 CasX 단백질로부터의 NTSB, TSL, 나선형 II, OBD 및 RuvC 도메인, 및 제2 CasX 단백질로부터의 나선형 I 도메인을 포함할 수 있다. 키메라 CasX 단백질의 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 1, 서열번호: 2 또는 서열번호: 3의 서열로부터 유래되고, 제2 CasX 단백질의 도메인은 서열번호: 1, 서열번호: 2 또는 서열번호: 3의 서열로부터 유래되고, 제1 및 제2 CasX 단백질은 동일하지 않는다. 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 1로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 서열번호: 2로부터 유래된 서열을 포함한다. 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 1로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 서열번호: 3으로부터 유래된 서열을 포함한다. 일부 실시형태에서, 제1 CasX 단백질의 도메인은 서열번호: 2로부터 유래된 서열을 포함하고, 제2 CasX 단백질의 도메인은 서열번호: 3으로부터 유래된 서열을 포함한다. 일부 실시형태에서, CasX 변이체는 표 1에 기술된 바와 같은, 서열번호: 102, 113, 114, 115, 103, 104, 105, 106, 107, 108, 109 및 110의 서열을 갖는 CasX 변이체로 구성된 군에서 선택된다.
XDP 시스템의 일부 실시형태에서, CasX 변이체 단백질은 제1 CasX 단백질로부터 제1 부분 및 상이한 제2 CasX 단백질로부터 제2 부분을 포함하는 적어도 하나의 키메라 도메인을 포함한다. 본 명세서에 사용된 "키메라 도메인"은 2개의 자연적으로 발생하는 단백질 또는 2개의 참조 CasX 단백질로부터 도메인의 부분과 같은 상이한 공급원으로부터 단리되거나 유래된 적어도 2개의 부분을 함유하는 도메인을 지칭한다. 적어도 하나의 키메라 도메인은 본 명세서에 기재된 NTSB, TSL, 나선형 I, 나선형 II, OBD 또는 RuvC 도메인 중 임의의 것일 수 있다. 일부 실시형태에서, CasX 도메인의 제1 부분은 서열번호: 1의 서열을 포함하고 CasX 도메인의 제2 부분은 서열번호: 2의 서열을 포함한다. 일부 실시형태에서, CasX 도메인의 제1 부분은 서열번호: 1의 서열을 포함하고 CasX 도메인의 제2 부분은 서열번호: 3의 서열을 포함한다. 일부 실시형태에서, CasX 도메인의 제1 부분은 서열번호: 2의 서열을 포함하고 CasX 도메인의 제2 부분은 서열번호: 3의 서열을 포함한다. 일부 실시형태에서, 적어도 하나의 키메라 도메인은 키메라 RuvC 도메인을 포함한다. 전기한 것의 예로서, 키메라 RuvC 도메인은 서열번호: 1의 아미노산 661 내지 824 및 서열번호: 2의 아미노산 922 내지 978을 포함한다. 전기한 것의 대안적인 예로서, 키메라 RuvC 도메인은 서열번호: 2의 아미노산 648 내지 812 및 서열번호: 1의 아미노산 935 내지 986을 포함한다. 일부 실시형태에서, CasX 단백질은 제1 CasX 단백질로부터 제1 도메인과 제2 CasX 단백질로부터 제2 도메인, 및 이 단락에 기재된 실시형태의 접근법을 사용하여 상이한 CasX 단백질로부터 단리된 적어도 2개의 부분을 포함하는 적어도 하나의 키메라 도메인을 포함한다. 전기한 실시형태에서, 서열번호: 1, 2 및 3으로부터 유래된 도메인 또는 도메인의 일부를 갖는 키메라 CasX 단백질은 본 명세서에 개시된 실시형태 중 임의의 것의 아미노산 삽입, 결실 또는 치환을 추가로 포함할 수 있다.
XDP 시스템의 일부 실시형태에서, CasX 변이체 단백질은 표 1, 7, 8, 9 또는 11에 제시된 바와 같은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함한다. 일부 실시형태에서, CasX 변이체 단백질은 표 1에 제시된 바와 같은 서열번호: 21-233의 서열로 이루어진다. 다른 실시형태에서, CasX 변이체 단백질은 표 1, 7, 8, 9 또는 11에 제시된 바와 같은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일한 서열을 포함한다. 다른 실시형태에서, CasX 변이체 단백질은 표 1에 제시된 서열을 포함하고, N-말단, C-말단, 또는 둘 모두에서 또는 그 근처에 본 명세서에 개시된 하나 이상의 NLS를 추가로 포함한다. 일부 경우에, 표의 CasX 변이체의 N-말단 메티오닌이 번역-후 변형 동안 발현된 CasX 변이체로부터 제거되는 것으로 이해될 것이다.
[표 1]: CasX 변이체 서열
* 숫자가 왼쪽 열에 표시된 경우 그것은 숫자로 CasX 변이체를 지정하며; 표시된 경우 변경은 서열번호:2에 대한 것이다.
g.
CasX 융합 단백질
CasX에 융합된 이종성 단백질을 포함하는 CasX 변이체 단백질을 포함하는 XDP가 또한 개시내용의 범주 내에서 고려된다. 일부 실시형태에서, CasX 변이체 단백질은 상이한 관심있는 활성을 갖는 하나 이상의 단백질 또는 그의 도메인에 융합되어 융합 단백질을 초래한다. 예를 들어, 일부 실시형태에서, CasX 변이체 단백질은 전사를 억제하거나, 표적 핵산을 변형하거나, 핵산과 연관된 폴리펩티드를 변형하는 (예를 들어, 히스톤 변형) 단백질 (또는 그의 도메인)에 융합된다.
일부 실시형태에서, 이종성 폴리펩티드 (또는 시스테인 잔기 또는 비-천연 아미노산과 같은 이종성 아미노산)는 XDP 시스템에서 이용되는 CasX 융합 단백질을 생성하기 위해 CasX 단백질 내의 하나 이상의 위치에 삽입될 수 있다. 다른 실시형태에서, 시스테인 잔기는 CasX 단백질 내의 하나 이상의 위치에 삽입되고 이어서 하기에 기재된 이종성 폴리펩티드의 접합이 뒤따를 수 있다. 일부 대안적인 실시형태에서, 이종성 폴리펩티드 또는 이종성 아미노산은 CasX 변이체 단백질의 N- 또는 C-말단에서 첨가될 수 있다. 다른 실시형태에서, 이종성 폴리펩티드 또는 이종성 아미노산은 CasX 단백질의 서열 내에 내부적으로 삽입될 수 있다.
다양한 이종성 폴리펩티드가 개시내용의 XDP 시스템에서 이용되는 CasX 변이체 융합 단백질에 함입되기에 적합하다. 일부 경우에, 융합 파트너는 표적 DNA의 전사를 조절(예를 들어, 전사를 억제, 전사를 증가)할 수 있다. 예를 들어, 일부 경우에 융합 파트너는 전사를 억제하는 단백질(또는 단백질로부터의 도메인)(예를 들어, 전사 억제제 단백질의 동원, 표적 DNA의 변형 예컨대 메틸화, DNA 변형자의 동원, 표적 DNA와 연관된 히스톤의 조절, 히스톤 변형자의 동원 예컨대 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 것, 등을 통해 기능하는 단백질인, 전사 억제인자)이다. 일부 경우에 융합 파트너는 전사를 증가시키는 단백질(또는 단백질의 도메인)(예를 들어, 전사 활성화제 단백질의 동원, 표적 DNA의 변형 예컨대 탈메틸화, DNA 변형자의 동원, 표적 DNA와 연관된 히스톤의 조절, 히스톤 변형자의 동원 예컨대 히스톤의 아세틸화 및/또는 메틸화를 변형시키는 것, 등을 통해 작용하는 단백질인, 전사 활성화제)이다.
일부 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산을 변형시키는 효소적 활성(예를 들어, 뉴클레아제 활성, 메틸트랜스퍼라제 활성, 데메틸라제 활성, DNA 복구 활성, DNA 손상 활성, 탈아미노화 활성, 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 활성, 트랜스포사제 활성, 재조합효소 활성, 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 광분해효소 활성 또는 글리코실라제 활성)을 갖는다.
일부 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산과 연관된 폴리펩티드(예를 들어, 히스톤)를 변형시키는 효소적 활성(예를 들어, 메틸트랜스퍼라제 활성, 데메틸라제 활성, 아세틸트랜스퍼라제 활성, 데아세틸라제 활성, 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 또는 탈미리스토일화 활성)을 갖는다.
전사를 증가시키기 위해 XDP 시스템에서 이용되는 CasX 융합 파트너로 사용될 수 있는 단백질(또는 이의 단편)의 예는 전사 활성화제 예컨대 VP16, VP64, VP48, VP160, p65 서브도메인(예를 들어, NFkB로부터의 것), 및 EDLL의 활성화 도메인 및/또는 TAL 활성화 도메인(예를 들어, 식물에서의 활성을 위함); 히스톤 라이신 메틸트랜스퍼라제 예컨대 SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1 등; 히스톤 라이신 데메틸라제 예컨대 JHDM2a/b, UTX, JMJD3 등; 히스톤 아세틸트랜스퍼라제 예컨대 GCN5, PCAF, CBP, p300, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, SRC1, ACTR, P160, CLOCK 등; 및 DNA 데메틸라제 예컨대 Ten-Eleven Translocation(TET) 디옥시게나제 1(TET1CD), TET1, DME, DML1, DML2, ROS1 등을 포함하지만 이에 제한되지 않는다.
전사를 감소시키기 위해 XDP에서 CasX 융합 파트너로 사용될 수 있는 단백질(또는 이의 단편)의 예는 전사 억제인자 예컨대 크루펠 연관된 박스(KRAB 또는 SKD); KOX1 억제 도메인; Mad mSIN3 상호작용 도메인(SID); ERF 억제인자 도메인(ERD), SRDX 억제 도메인(예를 들어, 식물에서 억제를 위함) 등; 히스톤 라이신 메틸트랜스퍼라제 예컨대 Pr-SET7/8, SUV4-20H1, RIZ1 등; 히스톤 라이신 데메틸라제 예컨대 JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID 1C/SMCX, JARID1D/SMCY 등; 히스톤 라이신 데아세틸라제 예컨대 HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등; DNA 메틸라제 예컨대 HhaI DNA m5c-메틸트랜스퍼라제(M.HhaI), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물) 등; 및 주변 동원 요소 예컨대 라민 A, 라민 B 등을 포함하지만 이에 제한되지 않는다.
일부 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성의 예는 제한 효소에 의해 제공되는 것과 같은 뉴클레아제 활성(예를 들어, FokI 뉴클레아제), 메틸트랜스퍼라제에 의해 제공되는 것과 같은 메틸트랜스퍼라제 활성(예를 들어, Hhal DNA m5c-메틸트랜스퍼라제(M.Hhal), DNA 메틸트랜스퍼라제 1(DNMT1), DNA 메틸트랜스퍼라제 3a(DNMT3a), DNA 메틸트랜스퍼라제 3b(DNMT3b), METI, DRM3(식물), ZMET2, CMT1, CMT2(식물) 등); 데메틸라제에 의해 제공되는 것과 같은 데메틸라제 활성(예를 들어, Ten-Eleven Translocation(TET) 디옥시게나제 1(TET 1 CD), TET1, DME, DML1, DML2, ROS1 등), DNA 복구 활성, DNA 손상 활성, 탈아미노효소에 의해 제공되는 것과 같은 탈아미노화 활성(예를 들어, 시토신 탈아미노효소, 예를 들어 APOBEC 단백질 예컨대 랫트 APOBEC1), 디스뮤타제 활성, 알킬화 활성, 탈퓨린화 활성, 산화 활성, 피리미딘 이량체 형성 활성, 인테그라제 및/또는 리졸바제에 의해 제공되는 것과 같은 인테그라제 활성(예를 들어, Gin 인버타제 예컨대 Gin 인버타제인, GinH106Y의 과활성 돌연변이체; 인간 면역결핍 바이러스 유형 1 인테그라제(IN); Tn3 리솔바제; 등), 트랜스포사제 활성, 재조합효소에 의해 제공되는 것과 같은 재조합효소 활성(예를 들어, Gin 재조합효소의 촉매 도메인), 폴리머라제 활성, 리가제 활성, 헬리카제 활성, 광분해효소 활성 및 글리코실라제 활성)을 포함하지만 이에 제한되지 않는다.
다른 경우에, XDP 시스템에서 이용되는 본 개시내용의 CasX 변이체 단백질은 전사를 증가시키기 위한 도메인(예를 들어, VP16 도메인, VP64 도메인), 전사를 감소시키기 위한 도메인(예를 들어, Kox1 단백질로부터의, 예를 들어, KRAB 도메인), 히스톤 아세틸트랜스퍼라제의 코어 촉매 도메인(예를 들어, 히스톤 아세틸트랜스퍼라제 p300), 검출가능한 신호를 제공하는 단백질/도메인(예를 들어, GFP와 같은 형광 단백질), 뉴클레아제 도메인(예를 들어, Fokl 뉴클레아제) 및 염기 편집기(예를 들어, APOBEC1과 같은 시티딘 데아미나제)로부터 선택된 폴리펩티드에 융합된다.
또 다른 경우에, XDP 시스템에서 이용되는 CasX 융합 파트너는 표적 핵산(예를 들어, ssRNA, dsRNA, ssDNA, dsDNA)과 연관된 단백질(예를 들어, 히스톤, RNA 결합 단백질, DNA 결합 단백질 등)을 변형시키는 효소적 활성을 갖는다. 융합 파트너에 의해 제공될 수 있는 효소적 활성(표적 핵산과 연관된 단백질을 변형시키는 것)의 예는 히스톤 메틸트랜스퍼라제(HMT)에 의해 제공되는 것과 같은 메틸트랜스퍼라제 활성(예를 들어, 잡색 3-9 동족체 1의 억제제(SUV39H1, KMT1A로도 공지됨), 유색성 히스톤 라이신 메틸트랜스퍼라제 2(G9A, KMT1C 및 EHMT2로도 공지됨), SUV39H2, ESET/SETDB 1 등, SET1A, SET1B, MLL1 내지 5, ASH1, SYMD2, NSD1, DOT1L, Pr-SET7/8, SUV4-20H1, EZH2, RIZ1), 히스톤 데메틸라제에 의해 제공되는 것과 같은 데메틸라제 활성(예를 들어, 라이신 데메틸라제 1A(LSD1로도 공지된 KDM1A), JHDM2a/b, JMJD2A/JHDM3A, JMJD2B, JMJD2C/GASC1, JMJD2D, JARID1A/RBP2, JARID1B/PLU-1, JARID1C/SMCX, JARID1D/SMCY, UTX, JMJD3 등), 아세틸트랜스퍼라제 활성에 의해 제공되는 것과 같은 아세틸트랜스퍼라제 활성(예를 들어, 인간 아세틸트랜스퍼라제 p300, GCN5, PCAF, CBP, TAF1, TIP60/PLIP, MOZ/MYST3, MORF/MYST4, HB01/MYST2, HMOF/MYST1, SRC1, ACTR, P160, CLOCK 등의 촉매 코어/단편), 히스톤 데아세틸라제에 의해 제공되는 것과 같은 데아세틸라제 활성(예를 들어, HDAC1, HDAC2, HDAC3, HDAC8, HDAC4, HDAC5, HDAC7, HDAC9, SIRT1, SIRT2, HDAC11 등), 키나제 활성, 포스파타제 활성, 유비퀴틴 리가제 활성, 탈유비퀴틴화 활성, 아데닐화 활성, 탈아데닐화 활성, SUMO일화 활성, 탈SUMO일화 활성, 리보실화 활성, 탈리보실화 활성, 미리스토일화 활성 및 탈미리스토일화 활성을 포함하지만 이에 제한되지 않는다.
적합한 엽록체 전이 펩티드는 다음을 포함하지만 이에 제한되지 않는다:
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKCMQVWPPIGKKKFETLSYLPPLTRDSRA (서열번호: 116);
MASMISSSAVTTVSRASRGQSAAMAPFGGLKSMTGFPVRKVNTDITSITSNGGRVKS (서열번호: 117);
MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIEKKKFETLSYLPDLTDSGGRVNC (서열번호: 118;
MAQVSRICNGVQNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC (서열번호: 119);
MAQVSRICNGVWNPSLISNLSKSSQRKSPLSVSLKTQQHPRAYPISSSWGLKKSGMTLIG SELRPLKVMSSVSTAC (서열번호: 120);
MAQINNMAQGIQTLNPNSNFHKPQVPKSSSFLVFGSKKLKNSANSMLVLKKDSIFMQLF CSFRISASVATAC (서열번호: 121);
MAALVTSQLATSGTVLSVTDRFRRPGFQGLRPRNPADAALGMRTVGASAAPKQSRKPH RFDRRCLSMVV (서열번호: 122);
MAALTTSQLATSATGFGIADRSAPSSLLRHGFQGLKPRSPAGGDATSLSVTTSARATPKQQRSVQRGSRRFPSVVVC (서열번호: 123);
MASSVLSSAAVATRSNVAQANMVAPFTGLKSAASFPVSRKQNLDITSIASNGGRVQC (서열번호: 124);
MESLAATSVFAPSRVAVPAARALVRAGTVVPTRRTSSTSGTSGVKCSAAVTPQASPVIS RSAAAA (서열번호: 125); 및
MGAAATSMQSLKFSNRLVPPSRRLSPVPNNVTCNNLPKSAAPVRTVKCCASSWNSTINGAAATTNGASAASS (서열번호: 126).
일부 경우에, 본 개시내용의 CasX 변이체 폴리펩티드는 엔도솜 탈출 펩티드를 포함할 수 있다. 일부 경우에, 엔도솜 탈출 폴리펩티드는 아미노산 서열 GLFXALLXLLXSLWXLLLXA(서열번호: 127)를 포함하며, 여기서 각각의 X는 라이신, 히스티딘, 및 아르기닌으로부터 독립적으로 선택된다. 일부 경우에, 엔도솜 탈출 폴리펩티드는 아미노산 서열 GLFHALLHLLHSLWHLLLHA(서열번호: 128), 또는 HHHHHHHH(서열번호: 129)를 포함한다.
ssRNA 표적 핵산을 표적화할 때 사용하기 위한 CasX 융합 파트너의 비-제한적인 예는 스플라이싱 인자(예를 들어, RS 도메인); 단백질 번역 성분(예를 들어, 번역 개시, 신장 및/또는 방출 인자, 예를 들어, eIF4G); RNA 메틸라제; RNA 편집 효소(예를 들어, RNA 데아미나제, 예를 들어, A에서 I 및/또는 C에서 U 편집 효소를 포함하는 RNA에 작용하는 아데노신 데아미나제(ADAR)); 헬리카제; RNA-결합 단백질; 등을 포함한다(그러나 이에 제한되지 않는다). 이종성 폴리펩티드는 전체 단백질을 포함할 수 있거나 일부 경우에 단백질의 단편(예를 들어, 기능적 도메인)을 포함할 수 있는 것으로 이해된다.
융합 파트너는 일시적으로든 비가역적으로든, 직접적으로든 간접적으로든, 하기를 포함하는 군으로부터 선택된 이펙터 도메인을 포함하지만 이에 제한되지 않는, (본 개시내용의 목적을 위해, 분자내 및/또는 분자간 2차 구조, 예를 들어 헤어핀, 줄기-고리 등과 같은 이중-가닥 RNA 이중체를 포함하는) ssRNA와 상호작용할 수 있는 임의의 도메인일 수 있다: 엔도뉴클레아제(예를 들어, RNase III, CRR22 DYW 도메인, Dicer 및 SMG5 및 SMG6과 같은 단백질로부터의 PIN(PilT N-말단) 도메인); RNA 절단을 자극하는 것을 담당하는 단백질 및 단백질 도메인(예를 들어, CPSF, CstF, CFIm 및 CFIIm); 엑소뉴클레아제(예를 들어, XRN-1 또는 엑소뉴클레아제 T); 데아데닐라제(예를 들어, HNT3); 넌센스 매개된 RNA 붕괴를 담당하는 단백질 및 단백질 도메인(예를 들어, UPF1, UPF2, UPF3, UPF3b, RNP SI, Y14, DEK, REF2 및 SRm160); RNA 안정화를 담당하는 단백질 및 단백질 도메인(예를 들어, PABP); 번역 억제를 담당하는 단백질 및 단백질 도메인(예를 들어, Ago2 및 Ago4); 번역 자극을 담당하는 단백질 및 단백질 도메인(예를 들어, Staufen); 번역 조절을 담당하는(예를 들어, 할 수 있는) 단백질 및 단백질 도메인(예를 들어, 번역 인자 예컨대 개시 인자, 연장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 담당하는 단백질 및 단백질 도메인(예를 들어, PAP1, GLD-2 및 Star-PAP); RNA의 폴리우리디닐화를 담당하는 단백질 및 단백질 도메인(예를 들어, C1 D1 및 말단 우리딜레이트 트랜스퍼라제); RNA 국소화를 담당하는 단백질 및 단백질 도메인(예를 들어, IMP1, ZBP1, She2p, She3p 및 Bicaudal-D 유래); RNA의 핵 보유를 담당하는 단백질 및 단백질 도메인(예를 들어, Rrp6); RNA의 핵 유출을 담당하는 단백질 및 단백질 도메인(예를 들어, TAP, NXF1, THO, TREX, REF 및 Aly); RNA 스플라이싱의 억제를 담당하는 단백질 및 단백질 도메인(예를 들어, PTB, Sam68 및 hnRNP A1); RNA 스플라이싱의 자극을 담당하는 단백질 및 단백질 도메인(예를 들어, 세린/아르기닌-풍부(SR) 도메인); 전사의 효율을 감소시키는 것을 담당하는 단백질 및 단백질 도메인(예를 들어, FUS(TLS)); 및 전사 자극을 담당하는 단백질 및 단백질 도메인(예를 들어, CDK7 및 HIV Tat). 대안적으로, 이펙터 도메인은 엔도뉴클레아제; RNA 절단을 자극할 수 있는 단백질 및 단백질 도메인; 엑소뉴클레아제; 데아데닐라제; 넌센스 매개된 RNA 붕괴 활성을 갖는 단백질 및 단백질 도메인; RNA를 안정화할 수 있는 단백질 및 단백질 도메인; 번역을 억제할 수 있는 단백질 및 단백질 도메인; 번역을 자극할 수 있는 단백질 및 단백질 도메인; 번역을 조절할 수 있는 단백질 및 단백질 도메인(예를 들어, 번역 인자 예컨대 개시 인자, 연장 인자, 방출 인자 등, 예를 들어, eIF4G); RNA의 폴리아데닐화를 할 수 있는 단백질 및 단백질 도메인; RNA의 폴리우리디닐화를 할 수 있는 단백질 및 단백질 도메인; RNA 국소화 활성을 갖는 단백질 및 단백질 도메인; RNA의 핵 보유를 할 수 있는 단백질 및 단백질 도메인; RNA 핵 유출 활성을 갖는 단백질 및 단백질 도메인; RNA 스플라이싱의 억제를 할 수 있는 단백질 및 단백질 도메인; RNA 스플라이싱의 자극을 할 수 있는 단백질 및 단백질 도메인; 전사의 효율을 감소시킬 수 있는 단백질 및 단백질 도메인; 및 전사를 자극할 수 있는 단백질 및 단백질 도메인을 포함하는 군으로부터 선택될 수 있다. 또 다른 적합한 이종성 폴리펩티드는 WO2012068627에 더 자세히 기술되어 있는 PUF RNA-결합 도메인이며, 이는 그 전체가 참고로 본 명세서에 포함된다.
XDP 시스템에서 CasX 융합 파트너로서 (전체적으로 또는 이의 단편으로서) 사용될 수 있는 일부 RNA 스플라이싱 인자는 별도의 서열-특이적 RNA 결합 모듈 및 스플라이싱 이펙터 도메인을 갖는 모듈식 조직화를 갖는다. 예를 들어, 세린/아르기닌-풍부(SR) 단백질 패밀리의 구성원은 엑손 함입을 촉진하는 pre-mRNA 및 C-말단 RS 도메인에서 엑손 스플라이싱 인핸서(ESE)에 결합하는 N-말단 RNA 인식 모티프(RRM)를 함유한다. 또 다른 예로서, hnRNP 단백질 hnRNP A1은 그 RRM 도메인을 통해 엑손 스플라이싱 사일런서(ESS)에 결합하고 C-말단 글리신-풍부 도메인을 통해 엑손 함입을 억제한다. 일부 스플라이싱 인자는 2개의 대체적인 부위 사이의 조절 서열에 결합함에 의해 스플라이스 부위(ss)의 대체적인 사용을 조절할 수 있다. 예를 들어, ASF/SF2는 ESE를 인식하고 인트론 근위 부위의 사용을 촉진할 수 있는 반면, hnRNP A1은 ESS에 결합하고 인트론 원위 부위의 사용을 향해 스플라이싱을 이동할 수 있다. 이러한 요인에 대한 하나의 적용은 내인성 유전자, 특히 질환 연관된 유전자의 대체적인 스플라이싱을 조절하는 ESF를 생성하는 것이다. 예를 들어, Bcl-x pre-mRNA는 반대 기능의 단백질을 인코딩하기 위해 2개의 대체적인 5' 스플라이스 부위가 있는 2개의 스플라이싱 이소폼을 생성한다. 긴 스플라이싱 이소폼 Bcl-xL은 수명이 긴 유사분열 후 세포에서 발현되는 강력한 세포자멸사 억제제이고 많은 암세포에서 상향-조절되어 세포를 세포자멸사 신호에 대해 보호한다. 짧은 이소폼 Bcl-xS는 향-세포자멸사 이소폼이고 회전율이 높은 세포(예를 들어, 림프구 발달)에서 높은 수준으로 발현된다. 2개의 Bcl-x 스플라이싱 이소폼의 비율은 코어 엑손 영역 또는 엑손 확장 영역(즉, 2개의 대체적인 5' 스플라이스 부위 사이)에 위치한 다중 시스-요소에 의해 조절된다. 더 많은 예는 WO2010075303을 참고하며, 이는 그 전체가 참고로 본 명세서에 포함된다.
XDP 시스템에서 이용되는 추가의 적합한 CasX 융합 파트너는 경계 요소인 단백질(또는 이의 단편)(예를 들어, CTCF), 말초 동원을 제공하는 단백질 및 이의 단편(예를 들어, 라민 A, 라민 B 등) 및 단백질 도킹 요소(예를 들어, FKBP/FRB, Pill/Abyl 등)를 포함하지만 이에 제한되지 않는다.
일부 경우에, 이종성 폴리펩티드(융합 파트너)는 그것이 융합되는 CasX의 세포하 국소화를 제공하며, 즉, 이종성 폴리펩티드는 세포하 국소화 서열(예를 들어, 핵에 표적화하기 위한 핵 국소화 신호(NLS), 핵 밖으로 융합 단백질을 유지하는 서열, 예를 들어, 핵의 유출 서열(NES), 세포질에 보유된 융합 단백질을 유지하는 서열, 미토콘드리아를 표적으로 하기 위한 미토콘드리아 국소화 신호, 엽록체에 표적화하기 위한 엽록체 국소화 신호, ER 보유 신호 등)을 함유한다. 일부 실시형태에서, 대상체 RNA-가이드된 폴리펩티드는 단백질이 핵에 표적화되지 않도록 NLS를 포함하지 않는다(이는 예를 들어 표적 핵산이 세포질에 존재하는 RNA인 경우 유리할 수 있다). 일부 실시형태에서, 융합 파트너는 추적 및/또는 정제의 용이성을 위한 태그(즉, 이종성 폴리펩티드가 검출가능한 표지임)(예를 들어, 형광 단백질, 예를 들어, 녹색 형광 단백질(GFP), 황색 형광 단백질(YFP), 적색 형광 단백질(RFP), 시안 형광 단백질(CFP), mCherry, tdTomato 등; 히스티딘 태그, 예를 들어, 6XHis 태그; 헤마글루티닌(HA) 태그; FLAG 태그; Myc 태그; 등)를 제공할 수 있다.
일부 경우에, XDP 시스템에서 사용하기 위한 CasX 변이체 단백질은 핵 국소화 신호(NLS)를 포함한다(이에 융합된다). 일부 경우에, CasX 변이체 단백질은 2개 이상, 3개 이상, 4개 이상, 또는 5개 이상 6개 이상, 7개 이상, 8개 이상의 NLS에 융합된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및/또는 C-말단에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, 하나 이상의 NLS(2개 이상, 3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 C-말단에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, 하나 이상의 NLS(3개 이상, 4개 이상, 또는 5개 이상의 NLS)는 N-말단 및 C-말단 둘 모두에 또는 그 근처(예를 들어, 50개 아미노산 이내)에 위치된다. 일부 경우에, NLS는 N-말단에 위치되고 NLS는 C-말단에 위치된다. 일부 경우에, CasX 변이체 단백질은 1 내지 10 NLS(예를 들어, 1-9, 1-8, 1-7, 1-6, 1-5, 2-10, 2-9, 2-8, 2-7, 2-6 또는 2-5 NLS)를 포함한다(이에 융합된다). 일부 경우에, CasX 변이체 단백질은 2 내지 5 NLS(예를 들어, 2-4 또는 2-3 NLS)를 포함한다(이에 융합된다).
NLS의 비-제한적인 예는 아미노산 서열 PKKKRKV(서열번호: 130)를 갖는 SV40 바이러스 대형 T-항원의 NLS; 뉴클레오플라스민으로부터의 NLS(예를 들어, 서열 KRPAATKKAGQAKKKK(서열번호: 131)를 갖는 뉴클레오플라스민 이분 NLS; 아미노산 서열 PAAKRVKLD(서열번호: 132) 또는 RQRRNELKRSP(서열번호: 133)를 갖는 c-myc NLS; 서열 NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 134)를 갖는 hRNPA1 M9 NLS; 임포트인-알파로부터의 IBB 도메인의 서열 RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호:135); 근종 T 단백질의 서열 VSRKRPRP(서열번호: 136) 및 PPKKARED(서열번호: 137); 인간 p53의 서열 PQPKKKPL(서열번호: 138); 마우스 c-abl IV의 서열 SALIKKKKKMAP(서열번호: 139); 인플루엔자 바이러스 NS1의 서열 DRLRR(서열번호: 140) 및 PKQKKRK(서열번호: 141); 간염 바이러스 델타 항원의 서열 RKLKKKIKKL(서열번호: 142); 마우스 Mxl 단백질의 서열 REKKKFLKRR(서열번호: 143); 인간 폴리(ADP-리보스) 폴리머라제의 서열 KRKGDEVDGVDEVAKKKSKK(서열번호: 144); 스테로이드 호르몬 수용체(인간) 글루코코르티코이드의 서열 RKCLQAGMNLEARKTKK(서열번호: 145); 보르나 질환 바이러스 P 단백질(BDV-P1)의 서열 PRPRKIPR(서열번호: 146); C형 간염 바이러스 비구조 단백질(HCV-NS5A)의 서열 PPRKKRTVV(서열번호: 147); LEF1의 서열 NLSKKKKRKREK(서열번호: 148); ORF57 시미래의 서열 RRPSRPFRKP(서열번호: 149); EBV LANA의 서열 KRPRSPSS(서열번호: 150); 인플루엔자 A 단백질의 서열 KRGINDRNFWRGENERKTR(서열번호: 151); 인간 RNA 헬리카제 A(RHA)의 서열 PRPPKMARYDN(서열번호: 152); 핵형 RNA 헬리카제 II의 서열 KRSFSKAF(서열번호: 153); TUS-단백질의 서열 KLKIKRPVK(서열번호: 154); 임포트인-알파와 연관된 서열 PKKKRKVPPPPAAKRVKLD(서열번호: 155); HTLV-1에서 Rex 단백질로부터 서열 PKTRRRPRRSQRKRPPT(서열번호: 156); 예쁜꼬마선충의 EGL-13 단백질로부터 서열 MSRRRKANPTKLSENAKKLAKEVEN(서열번호: 157); 및 서열 KTRRRPRRSQRKRPPT(서열번호: 158), RRKKRRPRRKKRR(서열번호: 159), PKKKSRKPKKKSRK(서열번호: 160), HKKKHPDASVNFSEFSK(서열번호: 161), QRPGPYDRPQRPGPYDRP(서열번호: 162), LSPSLSPLLSPSLSPL(서열번호: 163), RGKGGKGLGKGGAKRHRK(서열번호: 164), PKRGRGRPKRGRGR(서열번호: 165), 및 PKKKRKVPPPPKKKRKV(서열번호: 166)로부터 유래된 서열을 포함한다. 일반적으로, NLS(또는 다중 NLS)는 진핵 세포의 핵에서 참조 또는 CasX 변이체 융합 단백질의 축적을 유도하기에 충분한 강도의 것이다. 핵내 축적의 검출은 임의의 적절한 기술에 의해 수행될 수 있다. 예를 들어, 검출가능한 마커는 세포 내의 위치가 시각화될 수 있도록 참조 또는 CasX 변이체 융합 단백질에 융합될 수 있다. 세포 핵은 또한 세포로부터 단리될 수 있으며, 그 내용물은 그 다음 면역조직화학, 웨스턴 블롯 또는 효소 활성 검정과 같은 단백질을 검출하기 위한 임의의 적절한 프로세스에 의해 분석될 수 있다. 핵내 축적도 결정될 수 있다.
일부 경우에, 참조 또는 CasX 변이체 융합 단백질은 지질 이중층, 미셀, 세포막, 소기관 막 또는 소포막을 횡단하는 것을 용이하게 하는 단백질, 폴리뉴클레오티드, 탄수화물 또는 유기 또는 무기 화합물을 지칭하는 "단백질 형질도입 도메인" 또는 PTD(CPP - 세포 투과 펩티드로도 공지됨)를 포함한다. 작은 극성 분자에서 큰 거대분자 및/또는 나노입자의 범위일 수 있는 또 다른 분자에 부착된 PTD는 분자가 막을 횡단하는 것, 예를 들어, 세포외 공간에서 세포내 공간으로 또는 세포질에서 소기관 내로의 이동을 촉진한다. 일부 실시형태에서, PTD는 참조 또는 CasX 변이체 융합 단백질의 아미노 말단에 공유적으로 연결된다. 일부 실시형태에서, PTD는 참조 또는 CasX 변이체 융합 단백질의 카르복실 말단에 공유적으로 연결된다. 일부 경우에, PTD는 적절한 삽입 부위에서 참조 또는 CasX 변이체 융합 단백질의 서열에 내부적으로 삽입된다. 일부 경우에, 참조 또는 CasX 변이체 융합 단백질은 하나 이상의 PTD(예를 들어, 2개 이상, 3개 이상, 4개 이상의 PTD)를 포함한다(이에 접합된다, 융합된다). 일부 경우에, PTD는 하나 이상의 핵 국소화 신호(NLS)를 포함한다. PTD의 예는 YGRKKRRQRRR(서열번호: 167), RKKRRQRR(서열번호: 168)을 포함하는 HIV TAT의 펩티드 형질도입 도메인; YARAAARQARA(서열번호: 169); THRLPRRRRRR(서열번호: 170); 및 GGRRARRRRRR(서열번호: 171); 세포 내로의 진입을 지시하기에 충분한 수의 아르기닌을 포함하는 폴리아르기닌 서열(예를 들어, 3, 4, 5, 6, 7, 8, 9, 10, 또는 10-50 아르기닌(서열번호: 172)); VP22 도메인(Zender 등 (2002) Cancer Gene Ther. 9(6):489-96); 초파리 안테나페디아 단백질 형질도입 도메인(Noguchi 등 (2003) Diabetes 52(7): 1732-1737); 절단된 인간 칼시토닌 펩티드(Trehin 등 (2004) Pharm. Research 21:1248-1256); 폴리리신(Wender 등 (2000) Proc. Natl. Acad. Sci. USA 97: 13003-13008); RRQRRTSKLMKR(서열번호: 173); 트랜스포탄 GWTLNSAGYLLGKINLKALAALAKKIL(서열번호: 174); KALAWEAKLAKALAKALAKHLAKALAKALKCEA(서열번호: 175); 및 RQIKIWFQNRRMKWKK(서열번호: 176)를 포함하지만 이에 제한되지 않는다. 일부 실시형태에서, PTD는 활성화가능한 CPP(ACPP)이다(Aguilera 등 (2009) Integr Biol (Comb) June; 1(5-6): 371-381). ACPP는 절단가능한 링커를 통해 일치하는 다중음이온(예를 들어, Glu9 또는 "E9")에 연결된 다중양이온성 CPP(예를 들어, Arg9 또는 "R9")를 포함하며, 이는 순 전하를 거의 0으로 감소시키고 이에 의해 세포로의 부착 및 흡수를 억제한다. 링커의 절단시 다중음이온이 방출되어, 폴리아르기닌과 그 고유의 접착성을 국부적으로 벗겨내고, 따라서 ACPP를 "활성화"하여 막을 횡단한다.
일부 실시형태에서, 참조 또는 CasX 변이체 융합 단백질은 링커 폴리펩티드(예를 들어, 하나 이상의 링커 폴리펩티드)를 통해 내부로 삽입된 이종성 아미노산 또는 이종성 폴리펩티드(이종성 아미노산 서열)에 연결된 CasX 단백질을 포함할 수 있다. 일부 실시형태에서, 참조 또는 CasX 변이체 융합 단백질은 C-말단 및/또는 N-말단 끝에서 링커 폴리펩티드(예를 들어, 하나 이상의 링커 폴리펩티드)를 통해 이종성 폴리펩티드(융합 파트너)에 연결될 수 있다. 링커 폴리펩티드는 다양한 아미노산 서열 중 어느 하나를 가질 수 있다. 다른 화학적 연결이 배제되지는 않지만 단백질은 일반적으로 유연한 성질의 스페이서 펩티드에 의해 연결될 수 있다. 적합한 링커는 4개 아미노산 내지 40개 아미노산 길이, 또는 4개 아미노산 내지 25개 아미노산 길이의 폴리펩티드를 포함한다. 이들 링커는 일반적으로 합성적 링커-인코딩 올리고뉴클레오티드를 사용하여 단백질을 커플링함에 의해 생성된다. 어느 정도의 유연성이 있는 펩티드 링커가 사용될 수 있다. 연결 펩티드는 실질적으로 임의의 아미노산 서열을 가질 수 있으며, 바람직한 링커는 일반적으로 유연한 펩티드를 초래하는 서열을 가질 것이라는 점을 염두에 둔다. 글리신 및 알라닌과 같은 작은 아미노산의 사용은 유연한 펩티드를 만드는 데 유용하다. 이러한 서열의 생성은 당업자에게 일상적이다. 다양한 상이한 링커가 상업적으로 이용가능하고 사용하기에 적합한 것으로 간주된다. 예시적인 링커 폴리펩티드는 글리신 중합체 (G)n, 글리신-세린 중합체(예를 들어, (GS)n, GSGGSn(서열번호: 177), GGSGGSn(서열번호: 178) 및 GGGSn(서열번호: 179)를 포함하며, 여기서 n은 적어도 하나의 정수임), 글리신-알라닌 중합체, 알라닌-세린 중합체, 글리신-프롤린 중합체, 프롤린 중합체 및 프롤린-알라닌 중합체를 포함한다. 예시적인 링커는 GGSG(서열번호: 180), GGSGG(서열번호: 181), GSGSG(서열번호: 182), GSGGG(서열번호: 183), GGGSG(서열번호: 184), GSSSG(서열번호: 185), GPGP(서열번호: 186), GGP, PPP, PPAPPA(서열번호: 187), PPPGPPP(서열번호: 188) 등을 포함하지만 이에 제한되지 않는 아미노산 서열을 포함할 수 있다. 통상의 기술자는 상기 기재된 임의의 요소에 접합된 펩티드의 설계는 링커가 유연성 링커뿐만 아니라 유연성이 덜한 구조를 부여하는 하나 이상의 부분을 포함할 수 있도록 모두 또는 부분적으로 유연한 링커를 포함할 수 있음을 인식할 것이다.
h.
XDP 시스템의 가이드 핵산
또 다른 양태에서, 개시내용은 CasX:gNA 시스템의 가이드 핵산(gNA)을 인코딩하거나 통합하는 XDP 시스템 성분에 관한 것으로 여기서 gNA는 편집될 표적 핵산 서열에 상보적이도록 조작된 표적화 서열을 포함한다. 일부 실시형태에서, gNA는 상보적 비-표적 가닥에 TC 모티프를 포함하는 프로토스페이서 인접 모티프(PAM) 서열에 특이성을 갖는 CRISPR 단백질과 복합체를 형성할 수 있고, 여기서 PAM 서열은 표적 핵산의 표적 가닥에서 표적 핵산 서열에 상보적인 비-표적 가닥에서의 서열의 1개 뉴클레오티드 5'에 위치된다. 일부 실시형태에서, gNA는 클래스 2, 유형 V CRISPR 뉴클레아제와 복합체를 형성할 수 있다. 특정 실시형태에서, gNA는 CasX 뉴클레아제와 복합체를 형성할 수 있다.
참조 또는 자연적으로-발생하는 gNA는 표 2의 서열을 포함하여, 델타프로테오박터, 플랑크토마이세테스 또는 칸디다투스(본 명세서에 참고로 포함된, US20180346927A1 및 WO2018064371A1에 기재된 바와 같음)로부터 단리되거나 유래된 것을 포함하지만 이에 제한되지는 않는다. XDP 시스템의 일부 실시형태에서, 개시내용은 자연적으로-발생하는 gNA에 대해 하나 이상의 변형을 갖는 gNA 변이체를 제공하며, 변형된 gNA는 이후에 "gNA 변이체"로 지칭된다. 일부 경우에, 인코딩된 gNA 변이체는 참조 gNA의 서열에 대해 적어도 1, 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 또는 적어도 20, 또는 적어도 21, 또는 적어도 22, 또는 적어도 23, 또는 적어도 24, 또는 적어도 25 돌연변이를 갖는 서열을 포함하거나 이로 구성된다. 이들 돌연변이는 삽입, 결실, 뉴클레오티드 치환 또는 이의 임의의 조합일 수 있다. 일부 실시형태에서, gNA 변이체는 리보핵산 분자("gRNA")이다. 다른 실시형태에서, gNA 변이체는 우리딘 뉴클레오티드가 티미딘으로 대체된 데옥시리보핵산 분자("gDNA")이다. 일부 실시형태에서, gNA는 키메라이고, DNA 및 RNA 둘 모두를 포함한다.
XDP 시스템의 일부 실시형태에서, 다중 gNA(예를 들어, 2, 3, 4 또는 그 초과 gNA)가 표적 핵산의 변형을 위해 XDP 입자 내의 표적 세포 또는 조직에 전달되는 것으로 구상된다. 예를 들어, 단백질-인코딩 유전자 및/또는 조절 요소의 결실이 바람직한 경우, 유전자 또는 조절 요소 내의 2개의 상이한 부위에 결합하고 절단하기 위해 표적 핵산의 상이한 영역에 대한 표적화 서열을 갖는 한 쌍의 gNA가 사용될 수 있으며, 이는 그 다음 비-상동성 말단 연결(NHEJ), 상동-지향된 복구(HDR), 상동-독립적 표적화된 통합(HITI), 미세-상동 매개된 말단 연결(MMEJ), 단일 가닥 어닐링(SSA) 또는 염기 절제 복구(BER)에 의해 편집된다. 예를 들어, 하나 이상의 돌연변이 엑손 또는 서로 원위에 있는 둘 이상의 돌연변이를 갖는 표적 핵산의 서열을 결실하도록 설계된 편집 이벤트 경우, 한 쌍의 gNA는 CRISPR 뉴클레아제가 유전자 내에서 돌연변이(들)를 보유하는 엑손(들)의 2개의 상이한 부위 5' 및 3'에 결합하고 절단할 수 있도록 XDP 내에 통합될 수 있다. 핵산과 관련하여, 절단은 뉴클레아제에 의해, DNA 또는 RNA 중 하나인 핵산 분자의 공유 골격의 파단을 지칭한다. 단일-가닥 절단 및 이중-가닥 절단 둘 모두가 가능하고, 이중-가닥 절단은 2개의 별개의 단일-가닥 절단 이벤트의 결과로 발생할 수 있다. 일부 실시형태에서, 본 명세서에 기재된 실시형태의 CasX:gNA 시스템 및 세포 복구 시스템에 의해 도입된 작은 삽입결실은 돌연변이 유전자의 단백질 판독 프레임을 복원할 수 있다("리프레이밍" 전략). 리프레이밍 전략이 사용될 때 세포는 단일 gNA와 접촉될 수 있다. 유전자의 긴 세그먼트을 결실시키는 경우에, 개시내용은 그것이 결실되거나 정확한 서열을 갖는 공여자 주형으로 대체될 수 있도록 세그먼트 5' 및 3'에 측접하는 표적화 서열의 사용을 고려한다. 다른 경우에, HTT 유전자의 결실 또는 녹-다운/녹-아웃이 바람직한 경우, 표적 핵산 서열의 상이하거나 중첩되는 영역에 대한 표적화 서열을 갖는 한 쌍의 gNA가 결합하기 위해 그리고 CasX를 유전자의 엑손 또는 조절 요소 내 또는 그 근위에 2개의 상이하거나 중첩하는 부위에서 절단하기 위해 사용될 수 있으며, 이는 그 다음 비-상동성 말단 연결(NHEJ), 상동-지향된 복구(HDR, 예를 들어, HTT 엑손의 전체 또는 일부를 대체하기 위한 공여자 주형의 삽입을 포함할 수 있음), 상동-독립적 표적화된 통합(HITI), 미세-상동 매개된 말단 연결(MMEJ), 단일 가닥 어닐링(SSA) 또는 염기 절제 복구(BER)에 의해 편집된다.
개시내용의 gNA 변이체는 참조 gNA에 비해 증진된 또는 다양한 특성을 갖는 하나 이상의 gNA 변이체를 생성하기 위해 깊은 돌연변이 진화(DME)(본 명세서에 참고로 포함된 미국 특허 출원 일련 번호 PCT/US20/36506에 기재된 바와 같음), 깊은 돌연변이 스캐닝(DMS), 오류 경향의 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 엊갈린 확장 PCR, 유전자 셔플링 또는 도메인 스와핑을 포함할 수 있는 다수의 돌연변이유발 방법에 의해 설계 및 생성될 수 있다. 참조 gNA의 활성은 gNA 변이체의 활성이 비교되는 벤치마크로 사용될 수 있으며, 이에 의해 gNA 변이체의 기능 또는 기타 특성에서 개선을 측정할 수 있다. 다른 실시형태에서, 참조 gNA는 gNA 변이체, 예를 들어 합리적으로 설계된 변이체를 생성하기 위해 하나 이상의 의도적인 표적화된 돌연변이를 받을 수 있다.
개시내용의 gNA는 2개의 세그먼트인: 표적화 서열 및 단백질-결합 세그먼트을 포함한다. gNA의 표적화 세그먼트는 아래에 더 자세히 기술된, 표적 핵산 서열(예를 들어, 표적 ssRNA, 표적 ssDNA, 이중 가닥 표적 DNA의 가닥 등) 내의 특정 서열(표적 부위)에 상보적인(따라서 이와 혼성화하는) 뉴클레오티드 서열(가이드 서열, 스페이서, 표적자 또는 표적화 서열로 상호교환가능하게 지칭됨)을 포함한다. gNA의 표적화 서열은 코딩 서열, 코딩 서열의 상보체, 비-코딩 서열을 포함하는 표적 핵산 서열, 및 조절 요소에 결합할 수 있다. 단백질-결합 세그먼트(또는 "활성화제" 또는 "단백질-결합 서열")는 복합체로서 CasX 단백질과 상호작용(예를 들어, 결합)하여, RNP를 형성한다(아래에 더 자세히 기술됨). 단백질-결합 세그먼트는 대안적으로 본 명세서에서 "스캐폴드"로 지칭되며, 이는 아래에서 더 자세히 기술되는 여러 영역으로 구성된다.
이중 가이드 RNA(dgRNA)의 경우, 표적자 및 활성화제 부분은 각각 이중체-형성 세그먼트을 가지며, 여기서 표적자의 이중체 형성 세그먼트와 활성화제의 이중체-형성 세그먼트는 서로 상보성을 갖고 서로 혼성화하여 이중 가닥 이중체(gRNA의 경우 dsRNA 이중체)를 형성한다. gNA가 gRNA인 경우, 용어 "표적자" 또는 "표적자 RNA"는 본 명세서에서 CasX 이중 가이드 RNA의 crRNA-유사 분자(crRNA: "CRISPR RNA")(따라서 "활성화제"와 "표적자"가, 예를 들어, 개재 뉴클레오티드에 의해 함께 연결된 경우 CasX 단일 가이드 RNA의 것)를 지칭하기 위해 사용된다. crRNA는 tracrRNA와 이어지는 표적화 서열의 뉴클레오티드로 어닐링하는 5' 영역을 가진다. 따라서, 예를 들어, 가이드 RNA(dgRNA 또는 sgRNA)는 가이드 서열 및 crRNA 반복으로도 지칭될 수 있는 crRNA의 이중체-형성 세그먼트를 포함한다. 상응하는 tracrRNA-유사 분자(활성화제)는 또한 가이드 RNA의 단백질-결합 세그먼트의 dsRNA 이중체의 나머지 절반을 형성하는 뉴클레오티드의 이중체-형성 스트레치를 포함한다. 따라서, 표적자 및 활성화제는 상응하는 쌍으로서 혼성화하여 이중 가이드 NA를 형성하며, 이는 본 명세서에서 "이중 가이드 NA", "이중-분자 gNA", "dgNA", "이중-분자 가이드 NA" 또는 "2-분자 가이드 NA"로 지칭된다. CasX 단백질에 의한 표적 핵산 서열(예를 들어, 게놈 DNA)의 부위-특이적 결합 및/또는 절단은 gNA의 표적화 서열과 표적 핵산 서열 사이의 염기-쌍 상보성에 의해 결정된 하나 이상의 위치(예를 들어, 표적 핵산의 서열)에서 일어날 수 있다. 따라서, 예를 들어, 개시내용의 gNA는 TC PAM 모티프 또는 PAM 서열, 예컨대 ATC, CTC, GTC, 또는 TTC에 상보적인 서열에 인접한 표적 핵산에 대해 상보성인 서열을 갖고 따라서 이와 혼성화할 수 있다. 가이드 서열의 표적화 서열은 표적 핵산 서열의 서열과 혼성화되기 때문에, PAM 서열의 위치를 고려하는 한, 표적자는 특정 표적 핵산 서열과 혼성화하도록 사용자에 의해 변형될 수 있다. 따라서, 일부 경우에 표적자의 서열이 비-자연적으로 발생하는 서열일 수 있다. 다른 경우에, 표적자의 서열은 편집될 유전자로부터 유래된 자연적으로-발생하는 서열일 수 있다. 다른 실시형태에서, gNA의 활성화제 및 표적자는 (서로 혼성화하기 보다는) 서로 공유적으로 연결되고 본 명세서에서 "단일-분자 gNA", "일-분자 가이드 NA", "단일 가이드 NA", "단일 가이드 RNA", "단일-분자 가이드 RNA", "일-분자 가이드 RNA", "단일 가이드 DNA", "단일-분자 DNA" 또는 "일-분자 가이드 DNA", ("sgNA", "sgRNA" 또는 "sgDNA")로 지칭되는 단일 분자를 포함한다. 일부 실시형태에서, sgNA는 "활성화제" 또는 "표적자"를 포함하고 따라서 각각 "활성화제-RNA" 및 "표적자-RNA"일 수 있다.
집합적으로, 개시내용의 어셈블리된 gNA는 4개의 별도 영역 또는 도메인을 포함한다: 개시내용의 실시형태에서 표적 핵산에 특이적이고 gNA의 3' 말단에 위치한 RNA 삼중체, 스캐폴드 줄기, 연장된 줄기, 및 표적화 서열. RNA 삼중체, 스캐폴드 줄기, 연장된 줄기는 함께 gNA의 "스캐폴드"로 지칭된다.
i.
RNA 삼중체
본 명세서에 제공된 가이드 NA(참조 sgNA 포함)의 일부 실시형태에서, RNA-삼중체가 있고, RNA 삼중체는 2개의 개재하는 줄기 고리(스캐폴드 줄기 고리 및 연장된 줄기 고리) 후에 AAAG로 종료하는 UUU--nX(~4-15)--UUU 줄기 고리( 서열번호: 189)를 포함하여, 삼중체를 지나 이중체 가매듭으로 연장될 수 있는 가매듭을 형성한다. 삼중체의 UU-UUU-AAA 서열은 스페이서, 스캐폴드 줄기 및 연장된 줄기 사이의 넥서스로 형성된다. 예시적인 참조 CasX sgNA에서, UUU-고리-UUU 영역은 먼저 코딩된 다음 스캐폴드 줄기 고리에 대해 코딩되고 그 다음 연장된 줄기 고리에 대해 코딩되며, 이는 사중고리에 의해 연결된 다음 AAAG가 스페이서가 되기 전에 삼중체를 닫는다.
j.
스캐폴드 줄기 고리
개시내용의 CasX sgNA의 일부 실시형태에서, 삼중체 영역은 스캐폴드 줄기 고리가 뒤따른다. 스캐폴드 줄기 고리는 CasX 단백질(예컨대 참조 또는 CasX 변이체 단백질)에 의해 결합되는 gNA의 영역이다. 일부 실시형태에서, 스캐폴드 줄기 고리는 상당히 짧고 안정적인 줄기 고리이다. 일부 경우에, 스캐폴드 줄기 고리가 많은 변화를 용인하지 않고 일부 형태의 RNA 버블을 요한다. 일부 실시형태에서, 스캐폴드 줄기는 CasX sgNA 기능에 필요하다. 중요한 줄기 고리인 Cas9의 넥서스 줄기와 유사할 수 있지만, 일부 실시형태에서 CasX sgNA의 스캐폴드 줄기는 CRISPR/Cas 시스템에서 발견되는 다른 많은 줄기 고리와 상이한 필요한 돌출부(RNA 버블)를 갖는다. 일부 실시형태에서, 이 돌출부의 존재는 상이한 CasX 단백질과 상호작용하는 sgNA에 걸쳐 보존된다. gNA의 스캐폴드 줄기 고리 서열을 인코딩하는 예시적인 서열은 서열 CCAGCGACTATGTTCGTATGG(서열번호: 190)를 포함한다. 다른 실시형태에서, 개시내용은 스캐폴드 줄기 고리가, 일부 경우에 숙주 세포 핵 밖으로 이송을 촉진하기 위해 사용될 수 있는, MS2, Qβ, U1 헤어핀 II, Uvsx 또는 PP7 줄기 고리로 지정된 줄기 고리 서열과 같으나 이에 제한되지 않는 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 대체된 gNA 변이체를 제공한다. 일부 경우에, gNA의 이종성 RNA 줄기 고리는 단백질, RNA 구조, DNA 서열 또는 소분자에 결합할 수 있어 CasX에 대한 gNA의 결합을 촉진할 수 있다.
k.
연장된 줄기 고리
개시내용의 sgNA의 일부 실시형태에서, 스캐폴드 줄기 고리에 연장된 줄기 고리가 이어진다. 일부 실시형태에서, 연장된 줄기는 CasX 단백질에 의해 크게 결합되지 않은 합성 tracr 및 crRNA 융합체를 포함한다. 일부 실시형태에서, 연장된 줄기 고리는 고도로 가단성일 수 있다. 일부 실시형태에서, 단일 가이드 gRNA는 연장된 줄기 고리에서 tracr 및 crRNA 사이에 GAAA 사중고리 링커 또는 GAGAAA 링커로 만들어진다. 일부 경우에, CasX sgNA의 표적자 및 활성화제는 개재하는 뉴클레오티드에 의해 서로 연결되고 링커는 3 내지 20개 뉴클레오티드의 길이를 가질 수 있다. 개시내용의 CasX sgNA의 일부 실시형태에서, 연장된 줄기는 리보핵단백질 복합체에서 CasX 단백질의 외부에 위치하는 큰 32-bp 고리이다. sgNA의 연장된 줄기 고리 서열을 인코딩하는 예시적인 서열은 GCGCTTATTTATCGGAGAGAAATCCGATAAATAAGAAGC(서열번호: 191)를 포함한다. 일부 실시형태에서, 연장된 줄기 고리는 GAGAAA 스페이서 서열을 포함한다. 일부 실시형태에서, 개시내용은 연장된 줄기 고리가 MS2, Qβ, U1 헤어핀 II, Uvsx 또는 PP7 줄기 고리로 지정된 줄기 고리 서열과 같으나 이에 제한되지 않는 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 대체된 gNA 변이체를 제공한다. 이러한 경우에, 이종성 RNA 줄기 고리는 gNA의 안정성을 증가시킨다. 다른 실시형태에서, 개시내용은 적어도 10, 적어도 100, 적어도 500, 적어도 1000, 또는 적어도 10,000 뉴클레오티드, 또는 적어도 10-10,000, 적어도 10-1000, 또는 적어도 10-100 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 갖는 gNA 변이체를 제공한다. 일부 실시형태에서, 연장된 줄기 고리는 GAGAAA 스페이서 서열을 포함한다.
l.
표적화 서열(스페이서라고도 함)
XDP 시스템에서 이용되는 개시내용의 gNA의 일부 실시형태에서, 연장된 줄기 고리가 삼중체의 일부를 형성하는 영역과 그 다음 gNA의 3' 말단에서 표적화 서열(또는 "스페이서")에 이어진다. 표적화 서열은 변형되어 지는 유전자의 표적 핵산 서열의 특정 영역에 CasX 리보핵단백질 홀로 복합체를 표적화한다. 따라서, 예를 들어, 개시내용의 gNA 표적화 서열은 TC PAM 모티프 또는 PAM 서열 TTC, ATC, GTC 또는 CTC 중 임의의 하나가 표적 서열에 상보적인 비-표적 가닥 서열에 대해 1 뉴클레오티드 5'에 위치되는 경우 RNP의 성분으로서 진핵 세포에서 핵산(예를 들어, 진핵 염색체, 염색체 서열, 진핵 RNA, 등)에서의 HTT 유전자의 일부에 서열 상보성을 가지고, 따라서 이들에 혼성화할 수 있다. gNA의 표적화 서열은 PAM 서열 위치가 고려되는 한, gNA가 임의의 원하는 표적 핵산 서열의 원하는 서열을 표적화할 수 있도록 변형될 수 있다. 일부 실시형태에서, gNA 스캐폴드는 표적화 서열의 5'이고, 표적화 서열은 gNA의 3' 말단 상에 있다. 일부 실시형태에서, RNP의 뉴클레아제에 의해 인식되는 PAM 모티프 서열은 TC이다. 다른 실시형태에서, RNP의 뉴클레아제에 의해 인식되는 PAM 서열은 NTC이다.
일부 실시형태에서, XDP 시스템의 gNA는 (a) i) 야생형 서열일 수 있거나 하나 이상의 돌연변이를 포함할 수 있는 표적 단백질 또는 ii) 야생형 서열일 수 있는 단백질의 조절 요소를 코딩하는 핵산 서열에 상보적이거나; 또는 (b) 하나 이상의 돌연변이를 포함할 수 있는 단백질 또는 이의 조절 요소를 인코딩하는 핵산 서열의 상보체에 상보적인 표적화 서열을 포함한다. 일부 실시형태에서, gNA의 표적화 서열은 하나 이상의 돌연변이를 포함하는 표적 단백질을 인코딩하는 유전자의 일부에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 엑손에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 인트론에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 인트론-엑손 접합부에 특이적이다. 일부 실시형태에서, gNA의 표적화 서열은 표적 유전자 또는 그의 보체의 하나 이상의 단일 뉴클레오티드 다형성(SNP)을 포함하는 서열에 상보적이다. 다른 실시형태에서, gNA의 표적화 서열은 표적 유전자의 유전자간 영역의 서열 또는 표적 유전자의 유전자간 영역에 상보적인 서열에 상보적이다.
일부 실시형태에서, gNA의 표적화 서열은 표적 유전자의 발현을 조절하는 조절 요소에 특이적이다. 이러한 조절 요소는 프로모터 영역, 인핸서 영역, 유전자간 영역, 5' 비번역된 영역(5' UTR), 3' 비번역된 영역(3' UTR), 유전자간 영역, 유전자 인핸서 요소, 보존된 요소 및 시스-조절 요소를 포함하는 영역을 포함하지만 이에 제한되지 않는다. 프로모터 영역은 표적 유전자 개시점의 5kb 이내의 뉴클레오티드를 포괄하도록 의도되거나, 유전자 인핸서 요소 또는 보존된 요소의 경우 표적 유전자에 대해 1Mb 이상 원위일 수 있다. 일부 실시형태에서, 개시내용은 표적 유전자 조절 요소와 혼성화하는 표적화 서열을 갖는 gNA를 제공한다. 전기한 것에서 표적은 돌연변이를 포함하는 표적 단백질이 발현되지 않거나 세포에서 더 낮은 수준으로 발현되도록 표적의 인코딩 유전자가 녹아웃 또는 녹다운되도록 의도된 것들이다. 일부 실시형태에서, 개시내용은 gNA의 표적화 서열(또는 스페이서)이 표적 단백질, 표적 단백질의 일부, 조절 요소의 일부, 또는 표적 유전자에 대한 유전자 또는 조절 요소의 일부의 상보체를 인코딩하는 핵산 서열에 상보적인 CasX:gNA 시스템을 제공한다. 일부 실시형태에서, 표적화 서열은 14 내지 35개 연속적인 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 14, 15, 16, 18, 18, 19, 20, 21, 22, 23 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 연속적인 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 20개 연속적인 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 19개 연속적인 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 18개 연속적인 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 17개 연속적인 뉴클레오티드로 이루어진다. 일부 실시형태에서, 표적화 서열은 16개 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 15개 뉴클레오티드로 구성된다. 일부 실시형태에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 연속적인 뉴클레오티드를 가지고 표적화 서열은 표적 핵산 서열에 대해 0 내지 5, 0 내지 4, 0 내지 3, 또는 0 내지 2개 미스매치를 포함할 수 있고 표적화 서열을 포함하는 gNA를 포함하는 RNP가 표적 핵산에 대하여 상보적 결합을 형성할 수 있도록 충분한 결합 특이성을 유지할 수 있다.
일부 실시형태에서, XDP 시스템의 CasX:gNA는 제1 gNA를 포함하고 제2 (및 선택적으로 제3, 제4 또는 제5) gNA를 추가로 포함하며, 여기서 제2 gNA는 제1 gNA의 표적화 서열과 비교하여 표적 핵산 또는 이의 상보체의 상이한 부분에 상보적인 표적화 서열을 갖는다. gNA의 표적화 서열의 선택에 의해, 표적 핵산의 정의된 영역이 본 명세서에 기재된 CasX:gNA 시스템을 사용하여 변형되거나 편집될 수 있다.
m.
gNA 스캐폴드
표적화 서열 영역의 제외로, gNA의 나머지 영역은 본 명세서에서 스캐폴드로 지칭된다. 일부 실시형태에서, gNA 스캐폴드는 하기에 참조 gNA로 기재된 자연적으로-발생하는 서열로부터 유래된다. 다른 실시형태에서, gNA 스캐폴드는 gNA 변이체에 바람직한 특성을 부여하기 위해 돌연변이, 삽입, 결실 또는 도메인 치환이 도입된 참조 gNA의 변이체이다.
일부 실시형태에서, 참조 gRNA는 델타프로테오박테리아로부터 단리되거나 유래된 서열을 포함한다. 일부 실시형태에서, 서열은 CasX tracrRNA 서열이다. 델타프로테오박테리아로부터 단리되거나 유래된 예시적인 CasX 참조 tracrRNA 서열은 다음을 포함할 수 있다:
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGGAGA (서열번호: 6) 및
ACAUCUGGCGCGUUUAUUCCAUUACUUUGGAGCCAGUCCCAGCGACUAUGUCGUAUGGACGAAGCGCUUAUUUAUCGG (서열번호: 7). 델타프로테오박테리아로부터 단리되거나 유래된 예시적인 crRNA 서열은 CCGAUAAGUAAAACGCAUCAAAG (서열번호: 194)의 서열을 포함할 수 있다. 일부 실시형태에서, CasX 참조 gNA는 델타프로테오박테리아로부터 단리되거나 유래된 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다. 일부 실시형태에서, 참조 가이드 RNA는 플랑크토마이세테스로부터 단리되거나 유도된 서열을 포함한다. 일부 실시형태에서, 서열은 CasX tracrRNA 서열이다. 플랑크토마이세테스로부터 단리되거나 유도된 예시적인 참조 tracrRNA 서열은 다음을 포함할 수 있다:
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGGAGA(서열번호: 8) 및
UACUGGCGCUUUUAUCUCAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAUGGGUAAAGCGCUUAUUUAUCGG(서열번호: 9). 플랑크토마이세테스로부터 단리되거나 유도된 예시적인 crRNA 서열은 UCUCCGAUAAAUAAGAAGCAUCAAAG(서열번호: 197)의 서열을 포함할 수 있다. 일부 실시형태에서, CasX 참조 gNA는 플랑크토마이세테스로부터 단리되거나 유래된 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다.
일부 실시형태에서, 참조 gNA는 칸디다투스 성박테리아로부터 단리되거나 유도된 서열을 포함한다. 일부 실시형태에서, 서열은 CasX tracrRNA 서열이다. 칸디다투스 성박테리아로부터 단리되거나 유도된 예시적인 CasX 참조 tracrRNA 서열은: GUUUACACACUCCCUCUCAUAGGGU(서열번호: 10), GUUUACACACUCCCUCUCAUGAGGU(서열번호: 11), UUUUACAUACCCCCUCUCAUGGGAU(서열번호: 12) 및 GUUUACACACUCCCUCUCAUGGGGG(서열번호: 13)의 서열을 포함할 수 있다. 일부 실시형태에서, CasX 참조 가이드 RNA는 칸디다투스 성박테리아로부터 단리되거나 유도된 서열에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 81% 동일, 적어도 82% 동일, 적어도 83% 동일, 적어도 84% 동일, 적어도 85% 동일, 적어도 86% 동일, 적어도 86% 동일, 적어도 87% 동일, 적어도 88% 동일, 적어도 89% 동일, 적어도 89% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 적어도 99% 동일, 적어도 99.5% 동일 또는 100% 동일한 서열을 포함한다.
표 2는 참조 gRNA tracr, cr 및 스캐폴드 서열의 서열을 제공한다. 일부 실시형태에서, 개시내용은 gNA가 표 2의 서열번호: 4-16 중 임의의 하나의 서열을 갖는 참조 gNA 서열에 비해 적어도 하나의 뉴클레오티드 변형을 갖는 서열을 포함하는 스캐폴드를 갖는 gNA 서열을 제공한다. 벡터가 gNA에 대한 DNA 인코딩 서열을 포함하거나, gNA가 gDNA 또는 RNA 및 DNA의 키메라인 이들 실시형태에서, 티민(T) 염기가 표 2 및 표 3의 서열을 포함하여 본 명세서에 기재된 임의의 gNA 서열 실시형태의 우라실(U) 염기를 대체할 수 있다는 것이 이해될 것이다.
[표 2]. 참조 gRNA tracr 및 스캐폴드 서열
n.
gNA 변이체
또 다른 양태에서, 개시내용은 참조 gRNA 스캐폴드에 비해 하나 이상의 변형을 포함하는 가이드 핵산 변이체(본 명세서에서 대안적으로 "gNA 변이체" 또는 핵산 변이체가 RNA를 포함하는 경우 "gRNA 변이체"로 지칭됨)에 관한 것이다. 본 명세서에 사용된 "스캐폴드"는 스페이서 서열을 제외하고 gNA 기능에 필요한 gNA에 대한 모든 부분을 지칭한다.
일부 실시형태에서, gNA 변이체는 개시내용의 참조 gRNA 서열에 비해 하나 이상의 뉴클레오티드 치환, 삽입, 결실, 또는 교환되거나 대체된 영역을 포함한다. 일부 실시형태에서, 돌연변이는 참조 gRNA의 임의의 영역에서 발생하여 gNA 변이체를 생성할 수 있다. 일부 실시형태에서, gNA 변이체 서열의 스캐폴드는 서열번호: 4 또는 서열번호: 5의 서열에 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 또는 적어도 70%, 적어도 80%, 적어도 85%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는다.
일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 특성을 개선하는 참조 gRNA의 하나 이상의 영역 내에 하나 이상의 뉴클레오티드 변화를 포함한다. 예시적인 영역은 RNA 삼중체, 가매듭, 스캐폴드 줄기 고리 및 연장된 줄기 고리를 포함한다. 일부 경우에, 변이체 스캐폴드 줄기는 버블을 추가로 포함한다. 다른 경우에, 변이체 스캐폴드는 삼중체 고리 영역을 추가로 포함한다. 또 다른 경우에, 변이체 스캐폴드는 5' 비구조화 영역을 추가로 포함한다. 일 실시형태에서, gNA 변이체 스캐폴드는 서열번호: 14에 적어도 60% 서열 동일성을 갖는 스캐폴드 줄기 고리를 포함한다. 또 다른 실시형태에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열번호: 202)의 서열을 갖는 스캐폴드 줄기 고리를 포함한다. 또 다른 실시형태에서, 개시내용은 서열번호: 5에 비해 C18G 치환, G55 삽입, U1 결실, 및 원래의 6 nt 고리 및 13 최다-고리-근위 염기쌍(총 32개 뉴클레오티드)은 Uvsx 헤어핀(4 nt 고리 및 5 고리-근위 염기쌍; 총 14개 뉴클레오티드)에 의해 대체되고 연장된 줄기의 고리-원위 염기는 A99의 결실 및 G64U의 치환에 의해 새로운 Uvsx 헤어핀과 인접한 완전하게 염기-쌍을 이루는 줄기로 전환된, 변형된 연장된 줄기 고리를 포함하는 gNA 스캐폴드를 제공한다. 전기한 실시형태에서, gNA 스캐폴드는 서열 ACUGGCGCUUUUAUCUGAUUACUUUGAGAGCCAUCACCAGCGACUAUGUCGUAGUGGGUAAAGCUCCCUCUUCGGAGGGAGCAUCAAAG(서열번호 734)를 포함한다.
변이체 gNA가 본 명세서에 기재된 참조 gRNA와 비교할 때 하나 이상의 개선된 기능 또는 특징을 갖거나, 하나 이상의 새로운 기능을 추가하는 모든 gNA 변이체는 개시내용의 범주 내인 것으로 고려된다. 이러한 gNA 변이체의 대표적인 예는 가이드 174(서열번호: 734)이다. 일부 실시형태에서, gNA 변이체는 gNA 변이체를 포함하는 RNP에 새로운 기능을 추가한다. 일부 실시형태에서, gNA 변이체는 개선된 안정성; 개선된 용해도; gNA의 개선된 전사; 뉴클레아제 활성에 대한 개선된 내성; gNA의 증가된 접힘율; 접힘 동안 부산물 형성 감소; 증가된 생산적인 접힘; CasX 단백질에 대한 개선된 결합 친화성; CasX 단백질과 복합화될 때 표적 DNA에 대한 개선된 결합 친화성; CasX 단백질과 복합화될 때 개선된 유전자 편집; CasX 단백질과 복합화될 때 개선된 편집의 특이성; 및 CasX 단백질과 복합화될 때 표적 DNA의 편집에서 ATC, CTC, GTC 또는 TTC를 포함하는 하나 이상의 PAM 서열의 더 큰 스펙트럼을 이용하는 개선된 능력 또는 이의 임의의 조합으로부터 선택된 개선된 특성을 갖는다. 일부 경우에, gNA 변이체의 개선된 특성 중 하나 이상은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 적어도 약 1.1 내지 약 100,000-배 개선된다. 다른 경우에, gNA 변이체의 하나 이상의 개선된 특성은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 적어도 약 1.1, 적어도 약 10, 적어도 약 100, 적어도 약 1000, 적어도 약 10,000, 적어도 약 100,000-배 이상 개선된다. 다른 경우에, gNA 변이체의 개선된 특징 중 하나 이상은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 약 1.1 내지 100,000-배, 약 1.1 내지 10,000-배, 약 1.1 내지 1,000-배, 약 1.1 내지 500-배, 약 1.1 내지 100-배, 약 1.1 내지 50-배, 약 1.1 내지 20-배, 약 10 내지 100,00-배, 약 10 내지 10,00-배, 약 10 내지 1,000-배, 약 10 내지 500-배, 약 10 내지 100-배, 약 10 내지 50-배, 약 10 내지 20-배, 약 2 내지 70-배, 약 2 내지 50-배, 약 2 내지 30-배, 약 2 내지 20-배, 약 2 내지 10-배, 약 5 내지 50-배, 약 5 내지 30-배, 약 5 내지 10-배, 약 100 내지 100,000-배, 약 100 내지 10,000-배, 약 100 내지 1,000-배, 약 100 내지 500-배, 약 500 내지 100,00-배, 약 500 내지 10,000-배, 약 500 내지 1,000-배, 약 500 내지 750-배, 약 1,000 내지 100,00-배, 약 10,000 내지 100,00-배, 약 20 내지 500-배, 약 20 내지 250-배, 약 20 내지 200-배, 약 20 내지 100-배, 약 20 내지 50-배, 약 50 내지 10,000-배, 약 50 내지 1,000-배, 약 50 내지 500-배, 약 50 내지 200-배, 또는 약 50 내지 100-배 개선되었다. 다른 경우에, gNA 변이체의 하나 이상의 개선된 특성은 서열번호: 4 또는 서열번호: 5의 참조 gNA에 비해 약 1.1-배, 1.2-배, 1.3-배, 1.4-배, 1.5-배, 1.6-배, 1.7-배, 1.8-배, 1.9-배, 2-배, 3-배, 4-배, 5-배, 6-배, 7-배, 8-배, 9-배, 10-배, 11-배, 12-배, 13-배, 14-배, 15-배, 16-배, 17-배, 18-배, 19-배, 20-배, 25-배, 30-배, 40-배, 45-배, 50-배, 55-배, 60-배, 70-배, 80-배, 90-배, 100-배, 110-배, 120-배, 130-배, 140-배, 150-배, 160-배, 170-배 , 180-배, 190-배, 200-배, 210-배, 220-배, 230-배, 240-배, 250-배, 260-배, 270-배, 280-배, 290-배, 300-배, 310-배, 320-배, 330-배, 340-배, 350-배, 360-배, 370-배, 380-배, 390-배, 400-배, 425-배, 450-배, 475-배, 또는 500-배 개선되었다.
일부 실시형태에서, gNA 변이체는 개시내용의 gNA 변이체를 생성하기 위해, 심층 돌연변이 진화(DME), 심층 돌연변이 스캐닝(DMS), 오류 경향있는 PCR, 카세트 돌연변이유발, 무작위 돌연변이유발, 엊갈린 확장 PCR, 유전자 셔플링 또는 도메인 스와핑을 포함할 수 있는, 하기 본 명세서에 기술된 돌연변이유발 방법과 같은, 하나 이상의 돌연변이유발 방법에 참조 gRNA를 적용함에 의해 생성될 수 있다. 참조 gRNA의 활성은 gNA 변이체의 활성을 비교함에 의해 gNA 변이체의 기능에서 개선을 측정하는 벤치마크로 사용될 수 있다. 다른 실시형태에서, 참조 gRNA는 gNA 변이체, 예를 들어 합리적으로 설계된 변이체를 생성하기 위해 하나 이상의 의도적 표적화된 돌연변이, 치환 또는 도메인 교환을 거칠 수 있다. 이러한 방법에 의해 생성된 예시적인 gRNA 변이체는 실시예에 기재되어 있고 gNA 스캐폴드의 대표적인 서열은 표 3에 제시되어 있다.
일부 실시형태에서, gNA 변이체는 참조 가이드 핵산 스캐폴드 서열과 비교하여 하나 이상의 변형을 포함하며, 여기서 하나 이상의 변형은 gNA 변이체의 영역에서 적어도 하나의 뉴클레오티드 치환; gNA 변이체의 영역에서 적어도 하나의 뉴클레오티드 결실; gNA 변이체의 영역에서 적어도 하나의 뉴클레오티드 삽입; gNA 변이체의 영역의 전부 또는 일부의 치환; gNA 변이체의 영역의 전부 또는 일부의 결실; 또는 전기한 것의 임의의 조합으로부터 선택된다. 일부 경우에, 변형은 하나 이상의 영역에서 gNA 변이체에서 1 내지 15개 연속적인 또는 비-연속적인 뉴클레오티드의 치환이다. 다른 경우에, 변형은 하나 이상의 영역에서 gNA 변이체에서 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 결실이다. 다른 경우에, 변형은 하나 이상의 영역에서 gNA 변이체에서 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 삽입이다. 다른 경우에, 변형은 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 스캐폴드 줄기 고리 또는 연장된 줄기 고리의 치환이다. 일부 경우에, 개시내용의 gNA 변이체는 한 영역에서 2개 이상의 변형을 포함한다. 다른 경우에, 개시내용의 gNA 변이체는 2개 이상의 영역에서의 변형을 포함한다. 다른 경우에, gNA 변이체는 이 단락에 기술된 전기한 변형의 임의의 조합을 포함한다.
일부 실시형태에서, U6 프로모터로부터의 전사가 +1 뉴클레오티드가 G일 때 시작 부위와 관련하여 보다 효율적이고 보다 일관성이 있기 때문에, 5' G는 생체내 발현을 위해 gNA 변이체 서열에 추가된다. 다른 실시형태에서, T7 폴리머라제가 +1 위치에서 G 및 +2 위치에서 퓨린을 강력하게 선호하기 때문에, 2개의 5' G가 시험관내 전사를 위해 gNA 변이체 서열에 첨가되어 생산 효율을 증가시킨다. 일부 경우에, 5' G 염기는 표 2의 참조 스캐폴드에 추가된다. 다른 경우에, 5' G 염기는 표 3의 변형체 스캐폴드에 추가된다.
표 3은 개시내용의 예시적인 gNA 변이체 스캐폴드 서열을 제공한다. 표 3에서 (-)는 서열번호: 5의 참조 서열에 비해 특정된 위치(들)의 결실을 나타내고, (+)는 서열번호: 5에 비해 표시된 위치에서 특정된 염기(들)의 삽입을 나타내고, (:)는 서열번호: 5에 비해 결실 또는 치환의 특정된 시작:정지 좌표에서 염기의 범위를 나타내고, 다중 삽입, 결실 또는 치환은 콤마에 의해 분리된다; 예를 들어, A14C, T17G. 일부 실시형태에서, gNA 변이체 스캐폴드는 표 3에 열거된 서열, 또는 서열번호: 597-781, 또는 이들에 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 서열 동일성을 갖는 서열 중 임의의 하나를 포함한다. 벡터가 gNA에 대한 DNA 인코딩 서열을 포함하거나, gNA가 gDNA 또는 RNA 및 DNA의 키메라인 이들 실시형태에서, 티민(T) 염기가 본 명세서에 기재된 임의의 gNA 서열 실시형태의 우라실(U) 염기를 대체할 수 있음이 이해될 것이다.
[표 3]. 예시적인 gNA 변이체 스캐폴드 서열
일부 실시형태에서, gNA 변이체는 서열 -UUU-N4-25UUU-(서열번호: 203)를 포함하는 tracrRNA 줄기 고리를 포함한다. 예를 들어, gNA 변이체는 삼중체 영역에 기여하는 2개의 삼중항 U 모티프에 의해 측접되는 스캐폴드 줄기 고리 또는 이의 대체를 포함한다. 일부 실시형태에서, 스캐폴드 줄기 고리 또는 이들의 대체는 적어도 4개 뉴클레오티드, 적어도 5개 뉴클레오티드, 적어도 6개 뉴클레오티드, 적어도 7개 뉴클레오티드, 적어도 7개 뉴클레오티드, 적어도 8개 뉴클레오티드, 적어도 9개 뉴클레오티드, 적어도 10개 뉴클레오티드, 적어도 11개 뉴클레오티드, 적어도 12개 뉴클레오티드, 적어도 13개 뉴클레오티드, 적어도 14개 뉴클레오티드, 적어도 15개 뉴클레오티드, 적어도 16개 뉴클레오티드, 적어도 17개 뉴클레오티드, 적어도 18개 뉴클레오티드, 적어도 19개 뉴클레오티드, 적어도 20개 뉴클레오티드, 적어도 21개 뉴클레오티드, 적어도 22개 뉴클레오티드, 적어도 23개 뉴클레오티드, 적어도 24개 뉴클레오티드, 또는 적어도 25개 뉴클레오티드를 포함한다.
일부 실시형태에서, gNA 변이체는 스페이서 영역에 대해 5' 위치에 -AAAG-를 갖는 crRNA 서열을 포함한다. 일부 실시형태에서, -AAAG- 서열은 스페이서 영역에 대해 바로 5'이다.
일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 참조 gRNA에 비해 CasX 변이체 gNA에서 적어도 하나의 뉴클레오티드 결실을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 또는 비-연속적인 뉴클레오티드의 결실을 포함한다. 일부 실시형태에서, 적어도 하나의 결실은 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 뉴클레오티드의 결실을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 뉴클레오티드 결실을 포함하고 결실은 연속적인 뉴클레오티드에 있지 않는다. 참조 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적인 결실이 있는 이들 실시형태에서, 본 명세서에 기재된 바와 같은 임의의 결실 길이, 및 임의의 결실 길이의 조합이 개시내용의 범주 내인 것으로 고려된다. 예를 들어, 일부 실시형태에서, gNA 변이체는 1개 뉴클레오티드의 제1 결실, 및 2개 뉴클레오티드의 제2 결실을 포함할 수 있고, 2개 결실은 연속적이지 않다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 상이한 영역에서 적어도 2개의 결실을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 동일한 영역에 적어도 2개의 결실을 포함한다. 예를 들어, 영역은 연장된 줄기 고리, 스캐폴드 줄기 고리, 스캐폴드 줄기 버블, 삼중체 고리, 가매듭, 삼중체 또는 gNA 변이체의 5' 말단일 수 있다. 참조 gRNA에서 임의의 뉴클레오티드의 임의의 결실은 개시내용의 범주 내인 것으로 고려된다.
일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 적어도 하나의 뉴클레오티드 삽입을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 연속적인 또는 비-연속적인 뉴클레오티드의 삽입을 포함한다. 일부 실시형태에서, 적어도 하나의 뉴클레오티드 삽입은 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 뉴클레오티드의 삽입을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 2개 이상의 삽입을 포함하고, 삽입은 연속적이지 않다. 참조 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적인 삽입이 있는 실시형태에서, 본 명세서에 기재된 바와 같은 임의의 삽입 길이, 및 임의의 삽입 길이의 조합이 개시내용의 범주 내인 것으로 고려된다. 예를 들어, 일부 실시형태에서, gNA 변이체는 1개의 뉴클레오티드의 제1 삽입, 및 2개의 뉴클레오티드의 제2 삽입을 포함할 수 있고 2개의 삽입은 연속적이지 않다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 상이한 영역에 적어도 2개의 삽입을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 동일한 영역에 적어도 2개의 삽입을 포함한다. 예를 들어, 영역은 연장된 줄기 고리, 스캐폴드 줄기 고리, 스캐폴드 줄기 버블, 삼중체 고리, 가매듭, 삼중체 또는 gNA 변이체의 5' 말단일 수 있다. 참조 gRNA의 임의의 위치에서 A, G, C, U(또는 상응하는 DNA에서 T) 또는 이의 조합의 임의의 삽입은 개시내용의 범위 내인 것으로 고려된다.
일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 적어도 하나의 핵산 치환을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 또는 비-연속적인 치환된 뉴클레오티드를 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 1-4 뉴클레오티드 치환을 포함한다. 일부 실시형태에서, 적어도 하나의 치환은 참조 gRNA에 비해 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20 이상의 연속적인 뉴클레오티드의 치환을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA에 비해 2 이상의 치환을 포함하고, 치환은 연속적이지 않다. 참조 gRNA에 비해 gNA 변이체에 2개 이상의 비-연속적인 치환이 있는 이들 실시형태에서, 본 명세서에 기재된 바와 같은, 임의의 치환된 뉴클레오티드 길이, 및 임의의 치환된 뉴클레오티드 길이의 조합이 개시내용의 범주 내인 것으로 고려된다. 예를 들어, 일부 실시형태에서, gNA 변이체는 1개의 뉴클레오티드의 제1 치환을 포함할 수 있고, 2개의 뉴클레오티드의 제2 치환 및 2개의 치환은 연속적이지 않다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 상이한 영역에 적어도 2개의 치환을 포함한다. 일부 실시형태에서, gNA 변이체는 참조 gRNA의 동일한 영역에 적어도 2개의 치환을 포함한다. 예를 들어, 영역은 삼중체, 연장된 줄기 고리, 스캐폴드 줄기 고리, 스캐폴드 줄기 버블, 삼중체 고리, 가매듭, 삼중체, 또는 gNA 변이체의 5' 말단일 수 있다. 참조 gRNA의 임의의 위치에서 A, G, C, U(또는 상응하는 DNA에서 T) 또는 이의 조합의 임의의 치환은 개시내용의 범위 내인 것으로 고려된다.
본 명세서에 기재된 임의의 치환, 삽입 및 결실을 조합하여 개시내용의 gNA 변이체를 생성할 수 있다. 예를 들어, gNA 변이체는 참조 gRNA에 비해 적어도 하나의 치환 및 적어도 하나의 결실, 참조 gRNA에 비해 적어도 하나의 치환 및 적어도 하나의 삽입, 참조 gRNA에 비해 적어도 하나의 삽입 및 적어도 하나의 결실, 또는 참조 gRNA에 비해 적어도 하나의 치환, 하나의 삽입 및 하나의 결실을 포함할 수 있다.
일부 실시형태에서, gNA 변이체는 서열번호: 4-16 중 임의의 하나에 적어도 20% 동일, 적어도 30% 동일, 적어도 40% 동일, 적어도 50% 동일, 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 또는 적어도 99% 동일한 스캐폴드 영역을 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 4-16 중 임의의 하나에 적어도 60% 상동성(또는 동일한) 스캐폴드 영역을 포함한다.
일부 실시형태에서, gNA 변이체는 서열번호: 14에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 또는 적어도 99% 동일한 tracr 줄기 고리를 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 14에 적어도 60% 상동성(또는 동일한) tracr 줄기 고리를 포함한다.
일부 실시형태에서, gNA 변이체는 서열번호: 15에 적어도 60% 동일, 적어도 65% 동일, 적어도 70% 동일, 적어도 75% 동일, 적어도 80% 동일, 적어도 85% 동일, 적어도 90% 동일, 적어도 91% 동일, 적어도 92% 동일, 적어도 93% 동일, 적어도 94% 동일, 적어도 95% 동일, 적어도 96% 동일, 적어도 97% 동일, 적어도 98% 동일, 또는 적어도 99% 동일한 연장된 줄기 고리를 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 15에 적어도 60% 상동성(또는 동일한) 연장된 줄기 고리를 포함한다.
일부 실시형태에서, gNA 변이체는 다음과 같이 기술된 참조 gNA와 이러한 차이점을 갖는 외인성 연장된 줄기 고리를 포함한다. 일부 실시형태에서, 외인성 연장된 줄기 고리는 본 명세서에 개시된 참조 줄기 고리 영역(예를 들어, 서열번호: 15)에 대한 동일성이 거의 또는 전혀 없다. 일부 실시형태에서, 외인성 줄기 고리는 적어도 10bp, 적어도 20bp, 적어도 30bp, 적어도 40bp, 적어도 50bp, 적어도 60bp, 적어도 70bp, 적어도 80bp, 적어도 90bp, 적어도 100bp, 적어도 200bp, 적어도 300bp, 적어도 400bp, 적어도 500bp, 적어도 600bp, 적어도 700bp, 적어도 800bp, 적어도 900bp, 적어도 1,000bp, 적어도 2,000bp, 적어도 3,000bp, 적어도 4,000bp, 적어도 5,000bp, 적어도 6,000bp, 적어도 7,000bp, 적어도 8,000bp, 적어도 9,000bp, 적어도 10,000bp, 적어도 12,000bp, 적어도 15,000bp 또는 적어도 20,000bp이다. 일부 실시형태에서, gNA 변이체는 적어도 10, 적어도 100, 적어도 500, 적어도 1000, 또는 적어도 10,000 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 포함한다. 일부 실시형태에서, 이종성 줄기 고리는 gNA의 안정성을 증가시킨다. 일부 실시형태에서, 이종성 RNA 줄기 고리는 단백질, RNA 구조, DNA 서열, 또는 소분자에 결합할 수 있다. 일부 실시형태에서, 외인성 줄기 고리 영역은 RNA 줄기 고리 또는 헤어핀, 예를 들어 열안정성 RNA 예컨대 MS2(ACAUGAGGAUUACCCAUGU(서열번호: 204)), Qβ (UGCAUGUCUAAGACAGCA(서열번호: 205)), U1 헤어핀 II (AAUCCAUUGCACUCCGGAUU(서열번호: 206)), Uvsx (CCUCUUCGGAGG(서열번호: 207)), PP7 (AGGAGUUUCUAUGGAAACCCU(서열번호: 208)), 파지 복제 루프 고리 (AGGUGGGACGACCUCUCGGUCGUCCUAUCU(서열번호: 209)), 키싱 고리_a (UGCUCGCUCCGUUCGAGCA(서열번호: 210)), 키싱 고리_b1 (UGCUCGACGCGUCCUCGAGCA(서열번호: 211)), 키싱 고리_b2 (UGCUCGUUUGCGGCUACGAGCA(서열번호: 212)), G 사중체 M3q (AGGGAGGGAGGGAGAGG(서열번호: 213)), G 사중체 텔로미어 바스켓 (GGUUAGGGUUAGGGUUAGG(서열번호: 214)), 사르신-리신 고리 (CUGCUCAGUACGAGAGGAACCGCAG(서열번호: 215)) 또는 가매듭 (UACACUGGGAUCGCUGAAUUAGAGAUCGGCGUCCUUUCAUUCUAUAUACUUUGGAGUUUUAAAAUGUCUCUAAGUACA(서열번호: 216))을 포함한다. 일부 실시형태에서, 외인성 줄기 고리는 긴 비-코딩 RNA(lncRNA)를 포함한다. 본 명세서에 사용된 바와 같이, lncRNA는 길이가 대략 200bp보다 긴 비-코딩 RNA를 지칭한다. 일부 실시형태에서, 외인성 줄기 고리의 5' 및 3' 말단은 염기쌍을 이루고; 즉, 이중체 RNA의 영역을 형성하기 위해 상호작용한다. 일부 실시형태에서, 외인성 줄기 고리의 5' 및 3' 말단은 염기쌍을 이루고, 외인성 줄기 고리의 5' 및 3' 말단 사이의 하나 이상의 영역은 염기쌍을 이루지 않는다. 일부 실시형태에서, 적어도 하나의 뉴클레오티드 변형은 (a) 하나 이상의 영역에서 gNA 변이체에서 1 내지 15개 연속적인 또는 비-연속적인 뉴클레오티드의 치환; (b) 하나 이상의 영역에서 gNA 변이체에서 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 결실; (c) 하나 이상의 영역에서 gNA 변이체의 1 내지 10개 연속적인 또는 비-연속적인 뉴클레오티드의 삽입; (d) 근위 5' 및 3' 말단을 갖는 이종성 RNA 공급원으로부터의 RNA 줄기 고리 서열로 스캐폴드 줄기 고리 또는 연장된 줄기 고리의 치환; 또는 (a)-(d)의 임의의 조합을 포함한다.
일부 실시형태에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열번호: 202)의 스캐폴드 줄기 고리 서열을 포함한다. 일부 실시형태에서, gNA 변이체는 CCAGCGACUAUGUCGUAGUGG(서열번호: 202) 및 이에 대한 적어도 1, 2, 3, 4 또는 5개 미스매치의 스캐폴드 줄기 고리 서열을 포함한다.
일부 실시형태에서, gNA 변이체는 32개 미만의 뉴클레오티드, 31개 미만의 뉴클레오티드, 30개 미만의 뉴클레오티드, 29개 미만의 뉴클레오티드, 28개 미만의 뉴클레오티드, 27개 미만의 뉴클레오티드, 26개 미만의 뉴클레오티드. 뉴클레오티드, 25개 미만의 뉴클레오티드, 24개 미만의 뉴클레오티드, 23개 미만의 뉴클레오티드, 22개 미만의 뉴클레오티드, 21개 미만의 뉴클레오티드, 또는 20개 미만의 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 포함한다. 일부 실시형태에서, gNA 변이체는 32개 미만의 뉴클레오티드를 포함하는 연장된 줄기 고리 영역을 포함한다. 일부 실시형태에서, gNA 변이체는 열안정성 줄기 고리를 추가로 포함한다.
일부 실시형태에서, gNA는 RNA 결합 도메인을 포함한다. RNA 결합 도메인은 gNA 안으로 삽입된 레트로바이러스 Psi 패키징 요소일 수 있거나 CasX에 대한 gNA의 결합을 용이하게 할 수 있는 MS2, PP7, Q베타, U1A 또는 파지 R-고리로 구성된 군으로부터 선택된 단백질에 친화성을 갖는 줄기 고리이다. CasX 내로 통합된 단백질 구조에 친화성을 갖는 유사한 RNA 구성요소는 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭을 포함한다. 가이드 RNA 안으로 삽입된 Psi 패키징 요소의 통합은 부분적으로 Gag NC 단백질에 대한 Psi 서열의 높은 친화성 결합으로 인해 XDP 입자의 패키징을 용이하게 한다는 것이 발견되었다. 더욱이, RNP를 초래하는, gNA에 대한 CasX의 친화성으로 인해, XDP 내로 RNP의 통합이 더욱 용이하게 된다.
일부 실시형태에서, sgRNA 변이체는 서열번호: 597-781의 서열 또는 여기에 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 서열을 포함한다. 일부 실시형태에서, sgRNA 변이체는 서열번호: 597-781의 서열을 포함한다. 일부 실시형태에서, sgRNA 변이체는 서열번호: 597-781의 서열 및 표적화 서열을 포함한다.
일부 실시형태에서, sgRNA 변이체는 서열번호: 600, 서열번호: 602, 서열번호: 659, 서열번호: 603, 서열번호: 660, 서열번호: 661, 서열번호: 662, 서열번호: 599, 서열번호: 663, 서열번호: 601, 서열번호: 604, 서열번호: 608, 서열번호: 656, 서열번호: 666, 서열번호: 610, 서열번호: 667, 서열번호: 608, 서열번호: 669, 서열번호: 598, 서열번호: 670, 서열번호: 671, 서열번호: 605, 서열번호: 672, 서열번호: 734, 서열번호: 735, 서열번호: 736, 서열번호: 737, 서열번호: 770, 서열번호:771, 서열번호: 775, 또는 서열번호: 781의 서열을 포함한다.
일부 실시형태에서, gNA 변이체는 서열번호: 732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열 또는 여기에 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 동일성을 갖는 서열에 하나 이상의 추가의 변경을 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호: 597-781 중 임의의 하나의 서열에 하나 이상의 추가의 변경을 포함한다. 일부 실시형태에서, gNA 변이체는 서열번호:732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열을 포함한다. 일부 실시형태에서, gNA 변이체 스캐폴드는 서열번호:732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열로 구성되고, 본 명세서에 기재된 임의의 실시형태의 표적화 서열을 추가로 포함한다.
일부 실시형태에서, sgRNA 변이체는 서열번호: 600, 서열번호: 659, 서열번호: 603, 서열번호: 660, 서열번호: 661, 서열번호: 662, 서열번호: 599, 서열번호: 663, 서열번호: 601, 서열번호: 604, 서열번호: 608, 서열번호: 656, 서열번호: 666, 서열번호: 610, 서열번호: 667, 서열번호: 608, 서열번호: 669, 서열번호: 598, 서열번호: 670, 서열번호: 671, 서열번호: 605, 서열번호: 672, 서열번호: 734, 서열번호: 735, 서열번호: 736, 서열번호: 737, 서열번호:770, 서열번호:771, 서열번호: 775, 또는 서열번호: 781의 서열에 하나 이상의 추가의 변경을 포함한다.
개시내용의 gNA 변이체의 일부 실시형태에서, gNA 변이체는 적어도 하나의 변형을 포함하며, 여기서 서열번호: 5의 참조 가이드 스캐폴드와 비교하여 적어도 하나의 변형은 다음 중 하나 이상으로부터 선택된다: (a) 삼중체 고리에서 C18G 치환; (b) 줄기 버블에 G55 삽입; (c) U1 결실; (d) (i) 6 nt 고리 및 13 고리-근위 염기쌍이 Uvsx 헤어핀으로 대체되고; 그리고 (ii) 완전하게 염기쌍을 이루는 고리-말단 염기를 초래하는 A99의 결실 및 G65U의 치환인, 연장된 줄기 고리의 변형. 일부 실시형태에서, gNA 변이체는 서열번호: 732, 733, 734, 737, 740, 744, 745, 또는 755-781 중 임의의 하나의 서열을 포함한다.
XDP 시스템에서 이용되는 gNA 변이체는 앞서 보다 완전하게 기재된 gNA의 3' 말단에 위치한 스페이서(또는 표적화 서열) 영역을 추가로 포함하며, 여기서 스페이서는 편집되는 표적 핵산에 상보적인 서열로 설계된다. 일부 실시형태에서, gNA 변이체는 적어도 14 내지 30개 뉴클레오티드의 표적화 서열을 포함하며, 여기서 서열은 편집되는 표적 핵산에 상보적이다. 일부 실시형태에서, 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개 뉴클레오티드를 갖는다. 일부 실시형태에서, gNA 변이체는 20개 뉴클레오티드를 갖는 표적화 서열을 포함한다. 일부 실시형태에서, 표적화 서열은 25개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 24개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 23개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 22개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 21개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 20개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 19개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 18개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 17개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 16개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 15개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적화 서열은 14개 뉴클레오티드를 갖는다. 일부 실시형태에서, 표적 핵산은 표적화 서열의 제1 뉴클레오티드로부터 PAM을 분리하는 적어도 단일 뉴클레오티드와 함께 표적화 서열의 5'에 위치한 PAM 서열을 포함한다. 일부 실시형태에서, PAM은 표적 영역의 비-표적화된 가닥, 즉 표적 핵산에 상보적인 가닥 상에 위치한다. 일부 실시형태에서, PAM 서열은 TC 모티프이다. 일부 실시형태에서, PAM 서열은 ATC이다. 다른 실시형태에서, PAM 서열은 TTC이다. 다른 실시형태에서, PAM 서열은 GTC이다. 다른 실시형태에서, PAM 서열은 CTC이다.
일부 실시형태에서, gNA 변이체의 스캐폴드는 서열번호: 4 또는 서열번호: 5를 포함하는 참조 gRNA의 서열에 대한 하나 이상의 추가 변경을 포함하는 변이체이다. 참조 gRNA의 스캐폴드가 서열번호: 4 또는 서열번호: 5로부터 유래되는 이들 실시형태에서, gNA 변이체의 하나 이상의 개선되거나 추가된 특성이 서열번호: 4 또는 서열번호: 5에서 동일한 특성과 비교하여 개선된다.
XDP 시스템의 일부 실시형태에서, gNA 변이체의 스캐폴드는 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 여기에 적어도 약 50%, 적어도 약 60%, 적어도 약 70%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열 중 임의의 하나를 포함하는 CasX 변이체 단백질을 갖는 RNP의 일부이다. 전기한 실시형태에서, gNA는 표적화 서열을 추가로 포함한다.
o.
화학적으로 변형된 gNA
일부 실시형태에서, 개시내용은 화학적으로-변형된 gNA에 관한 것이다. 일부 실시형태에서, 본 개시내용은 가이드 RNA 기능성을 갖고 뉴클레아제에 의한 절단에 대한 감소된 민감성을 갖는 화학적으로-변형된 gNA를 제공한다. 4개의 규범적 리보뉴클레오티드 A, C, G, 및 U 이외의 임의의 뉴클레오티드, 또는 데옥시뉴클레오티드를 포함하는 gNA는 화학적으로 변형된 gNA이다. 일부 경우에, 화학적으로-변형된 gNA는 천연 포스포디에스테르 뉴클레오티드간 연결 이외의 임의의 백본 또는 뉴클레오티드간 연결을 포함한다. 특정 실시형태에서, 보유된 기능성은 본 명세서에 기재된 임의의 실시형태의 CasX에 결합하는 변형된 gNA의 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 표적 핵산 서열에 결합하는 변형된 gNA의 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 CasX 단백질을 표적화하는 것 또는 표적 핵산 서열에 결합하는 사전-복합체화된 CasX 단백질-gNA의 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 CasX-gNA에 의해 표적 폴리뉴클레오티드를 닉킹하는 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 CasX-gNA에 의해 표적 핵산 서열을 절단하는 능력을 포함한다. 특정 실시형태에서, 보유된 기능성은 개시내용의 실시형태의 CasX 단백질을 갖는 CasX 시스템에서 gNA의 임의의 다른 공지된 기능이다.
일부 실시형태에서, 개시내용은 뉴클레오티드 당 변형이 2'-O―C1-4알킬 예컨대 2'-O-메틸(2'-OMe), 2'-데옥시(2'-H), 2'-O―C1-3알킬-O―C1-3알킬 예컨대 2'-메톡시에틸("2'-MOE"), 2'-플루오로("2'-F"), 2'-아미노("2'-NH2"), 2'-아라비노실("2'-아라비노") 뉴클레오티드, 2'-F-아라비노실("2'-F-아라비노") 뉴클레오티드, 2'-잠금 핵산("LNA") 뉴클레오티드, 2'-잠금해제 핵산("ULNA") 뉴클레오티드, L 형태인 당("L-당"), 및 4'-티오리보실 뉴클레오티드로 구성된 군으로부터 선택된 gNA 안으로 합체된 화학적으로-변형된 gNA를 제공한다. 다른 실시형태에서, 가이드 RNA 안으로 합체된 뉴클레오티드간 연결 변형은 포스포로티오에이트 "P(S)"(P(S)), 포스포노카복실레이트(P(CH2)nCOOR) 예컨대 포스포노아세테이트 "PACE"( P(CH2COO-)), 티오포스포노카르복실레이트((S)P(CH2)nCOOR) 예컨대 티오포스포노아세테이트 "티오PACE"((S)P(CH2)nCOO-)), 알킬포스포네이트(P(C1-3알킬) 예컨대 메틸포스포네이트―P(CH3), 보라노포스포네이트(P(BH3)) 및 포스포로디티오에이트(P(S)2)로 구성된 군으로부터 선택된다.
특정 실시형태에서, 개시내용은 핵염기("염기") 변형이 2-티오우라실("2-티오U"), 2-티오시토신(" 2-티오C"), 4-티오우라실("4-티오U"), 6-티오구아닌("6-티오G"), 2-아미노아데닌("2-아미노A"), 2-아미노퓨린, 슈도우라실, 하이포잔틴, 7-데아자구아닌, 7-데아자-8-아자구아닌, 7-데아자데닌, 7-데아자-8-아자데닌, 5-메틸시토신("5-메틸C"), 5-메틸우라실("5-메틸U"), 5-하이드록시메틸시토신, 5-하이드록시메틸우라실, 5,6-디하이드로우라실, 5-프로피닐시토신, 5-프로피닐우라실, 5-에티닐시토신, 5-에티닐우라실, 5-알릴우라실("5-알릴U"), 5-알릴시토신("5-알릴C"), 5-아미노알릴우라실(" 5-아미노알릴U"), 5-아미노알릴-시토신("5-아미노알릴C"), 비염기성 뉴클레오티드, Z 염기, P 염기, 구조화되지 않은 핵산("UNA"), 이소구아닌("이소G"), 이소시토신("이소C"), 5-메틸-2-피리미딘, x(A,G,C,T) 및 y(A,G,C,T)로 구성된 군으로부터 선택된 gNA 안으로 합체된 화학적으로-변형된 gNA를 제공한다.
다른 실시형태에서, 개시내용은 하나 이상의 동위원소 변형이, 추적자로 사용되는 하나 이상의 15N, 13C, 14C, 중수소, 3H, 32P, 125I, 131I 원자 또는 기타 원자 또는 원소를 포함한 뉴클레오티드 포함하는, 뉴클레오티드 당, 핵염기, 포스포디에스테르 연결 및/또는 뉴클레오티드 포스페이트 상에 도입된 화학적으로-변형된 gNA를 제공한다.
일부 실시형태에서, gNA 안으로 합체된 "말단" 변형은 PEG(폴리에틸렌글리콜), 탄화수소 링커(헤테로원자(O,S,N)-치환된 탄화수소 스페이서; 할로-치환된 탄화수소 스페이서: 케토-, 카르복실-, 아미도-, 티오닐-, 카르바모일-, 티오노카르바마오일-함유 탄화수소 스페이서 포함), 스페르민 링커, 예를 들어 6-플루오레세인-헥실과 같은 링커에 부착된 형광 염료(예를 들어, 플루오레세인, 로다민, 시아닌)를 포함하는 염료, 소광제(예를 들어, dabcyl, BHQ) 및 기타 표지(예를 들어, 비오틴, 디곡시제닌, 아크리딘, 스트렙타비딘, 아비딘, 펩티드 및/또는 단백질)로 구성된 군으로부터 선택된다. 일부 실시형태에서, "말단" 변형은 데옥시뉴클레오티드 및/또는 리보뉴클레오티드의 올리고뉴클레오티드, 펩티드, 단백질, 당, 올리고당, 스테로이드, 지질, 엽산, 비타민 및/또는 기타 분자를 포함하는 또 다른 분자에 대한 gNA의 접합(또는 결찰)을 포함한다. 특정 실시형태에서, 개시내용은 "말단" 변형(상기 기재됨)이, 포스포디에스테르 연결로 합체되고 gNA에서 2개 뉴클레오티드 사이 어느 곳에서든 합체될 수 있는, 링커 예컨대, 예를 들어 2-(4-부틸아미도플루오레세인)프로판-1,3-디올 비스(포스포디에스테르) 링커를 통해 gNA 서열에 내부적으로 위치하는 화학적으로-변형된 gNA를 제공한다.
일부 실시형태에서, 개시내용은 형광 염료, 비-형광 표지, 태그(14C의 경우, 예를 들어 비오틴, 아비딘, 스트렙타비딘, 또는 15N, 13C, 중수소, 3H, 32P, 125I 등과 같은 동위원소 표지를 함유하는 부분), 올리고뉴클레오티드(압타머를 포함하는, 데옥시뉴클레오티드 및/또는 리보뉴클레오티드 포함), 아미노산, 펩티드, 단백질, 당, 올리고당, 스테로이드, 지질, 엽산, 비타민으로 구성된 군으로부터 선택된 원하는 모이어티에 후속적으로 접합될 수 있는, 아민, 티올(또는 설프히드릴), 하이드록실, 카르복실, 카르보닐, 티오닐, 티오카르보닐, 카르바모일, 티오카르바모일, 포스포릴, 알켄, 알킨, 할로겐 또는 작용기-말단화된 링커와 같은 말단의 작용기를 포함하는 말단 변형을 갖는 화학적으로-변형된 gNA를 제공한다. 접합은 N-하이드록시숙신이미드, 이소티오시아네이트, DCC(또는 DCI) 및/또는, 그 내용이 그 전체로 참고로 본 명세서에 포함된, "Bioconjugate Techniques" by Greg T. Hermanson, Publisher Elsevier Science, 3rd ed. (2013)에 기재된 바와 같은 임의의 다른 표준 방법을 통한 커플링을 포함하지만 이에 제한되지 않는 당업계에 잘-알려진 표준 화학을 이용한다.
III. XDP 시스템의 향성 인자 및 위형화
또 다른 양태에서, 개시내용은 유전자 편집을 위해 의도된 표적 세포 또는 조직에 대한 향성 및 선택성을 증가시키기 위한 XDP에서의 향성 인자의 혼입에 관한 것이다. XDP 실시형태의 향성 인자는 표적 세포 마커에 결합 친화성을 갖는 바이러스, 항체 단편, 및 수용체 또는 리간드로부터 유래된 외피 당단백질을 포함하지만 이에 제한되지 않는다. XDP 입자의 표면 상에 이러한 향성 인자의 함입은 XDP가 이러한 표적 세포 마커를 담지하는 표적 세포의 세포막에 선택적으로 결합하고 융합하는 능력을 고양시켜 치료적 지수가 증가하고 XDP 안으로 합체된 치료적 페이로드의 의도하지 않은 부작용이 감소한다.
일부 실시형태에서, XDP는 입자의 표면 상에 하나 이상의 당단백질(GP)을 포함하며 여기서 GP는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 다른 실시형태에서, XDP는 입자의 표면 상에 하나 이상의 항체 단편을 포함하며 여기서 항체 단편은 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 다른 실시형태에서, XDP는 입자의 표면 상에 G-단백질-연결된 수용체, 및 효소-연결된 수용체를 포함하는 하나 이상의 세포 표면 수용체를 포함하며 여기서 수용체는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 일부 실시형태에서, XDP는 입자의 표면 상에 하나 이상의 리간드를 포함하며 여기서 리간드는 세포 표면 상의 리간드에 대한 수용체를 담지하는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공한다. 또 다른 실시형태에서, XDP는 표적 세포에 대한 XDP의 증강된 또는 선택적인 결합 및 융합을 제공하기 위해 입자의 표면 상에 하나 이상의 당단백질, 항체 단편, 세포 수용체, 또는 리간드의 조합을 포함한다.
외피 바이러스의 경우, 바이러스 진입을 위한 막 융합은 막 당단백질 복합체에 의해 매개된다. 막 융합의 2가지 기본적 기계 원리는 외피 바이러스 중에서 보존되는 것으로 나타났다; 표적 막 계합 및 헤어핀-유사 구조로의 재접힘(Plemper, RK. Cell Entry of Enveloped Viruses. Curr Opin Virol. 1:92 (2011)). 외피 당단백질은 전형적으로 전자 현미경 이미지에서 정제된 비리온의 표면 상의 특징적인 단백질 "스파이크"로 관찰된다. 외피 바이러스에 의한 바이러스 진입의 기본 메커니즘은 위형화로 알려진 과정에서 XDP가 특정 세포 또는 기관을 표적화하도록 우선적으로 지시하는데 이용될 수 있다. 일부 실시형태에서, 개시내용의 XDP는 특정 기관 또는 세포에 대해 입증된 향성을 갖는 외피 바이러스로부터 유래된 당단백질의 혼입에 의해 위형화된다. 본 개시내용의 범주 내의 대표적인 당단백질은 표 4 및 실시예에 열거되어 있다. 일부 실시형태에서, 당단백질을 제공하기 위해 사용되는 바이러스는 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 푸그 합성 gP 융합, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7 , 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 알로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 수포성 구내염 바이러스의 당단백질 G(VSV-G), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스를 포함하지만 이에 제한되지 않는다. 당단백질 서열의 비-제한적 예는 표 4에 제공된다. 일부 실시형태에서, XDP는 표 4의 하나 이상의 당단백질 서열, 또는 여기에 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 서열 동일성을 갖는 서열을 포함하며, 여기서 당단백질은 입자 내로 합체되고 표면 상에 노출되어, 편집되는 표적 세포에 대해 XDP에 대한 향성 및 증강된 선택성을 제공한다.
[표 4]: XDP용 당단백질
일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 여기에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 서열을 갖는다. 일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열을 갖는다.
일부 실시형태에서, 당단백질은 아래에 기술된 XDP 시스템의 플라스미드 벡터에 당단백질을 인코딩하는 핵산의 함입에 의해 XDP 시스템에 합체된다. 일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열, 또는 여기에 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 동일성을 갖는 서열에 의해 인코딩된다. 일부 실시형태에서, 당단백질은 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열에 의해 인코딩된다.
일부 실시형태에서, 실시형태의 XDP의 캡시드에 외피 바이러스로부터 유래된 당단백질을 포함하는 XDP는 당단백질을 갖지 않는 XDP와 비교하여 표적 세포에 대한 XDP의 결합에서 적어도 2-배, 적어도 3-배, 또는 적어도 4-배, 또는 적어도 5-배, 또는 적어도 10-배 증가를 나타낸다. 이 경우에 표적 핵산의 유전자 편집을 향상시키는 표적 세포에 대한 당단백질을 담지하는 XDP의 향상된 결합 및 흡수를 입증하는 대표적인 실시예가 하기 실시예에 제공되어 있다.
일부 실시형태에서, 본 개시내용은 입자의 외부에 연결된 항체 단편을 포함하는 XDP를 제공하며 여기서 항체 단편은 표적 세포, 조직 또는 기관 상의 표적 세포 마커 또는 수용체에 특이적 결합 친화성을 가져, XDP가 표적 세포에 대한 향성을 제공한다. 일 실시형태에서, 항체 단편은 Fv, Fab, Fab', Fab'-SH, F(ab')2, 디아바디, 단일 사슬 디아바디, 선형 항체, 단일 도메인 항체, 단일 도메인 낙타과 항체, 및 단일-사슬 가변 단편(scFv) 항체로 구성된 군으로부터 선택된다. 예시적인 표적 세포는 T 세포, B 세포, 대식세포, 액체 암 세포(예컨대 백혈병 또는 골수종 세포), 고형 종양 세포, 근육 세포, 상피 세포, 내피 세포, 줄기 세포, 수지상 세포, 망막 세포, 간 세포, 심장 세포, 갑상선 세포, 뉴런, 신경교 세포, 희돌기아교세포, 슈반 세포 및 췌장 세포를 포함한다. 예시적인 표적 기관은 뇌, 심장, 간, 췌장, 폐, 눈, 위, 소장, 결장 및 신장을 포함한다. 예시적인 조직은 피부, 근육, 뼈, 상피 및 결합 조직을 포함한다. 표적 세포 마커 또는 리간드는 핵산 편집이 필요한 표적 세포에서 우선적으로 발현되는 것으로 알려진 세포 수용체 또는 표면 단백질을 포함할 수 있다. 이러한 경우에, 실시형태의 XDP의 캡시드에 항체 단편을 포함하는 XDP는 항체 단편을 갖지 않는 XDP에 비교하여 표적 세포 마커 또는 수용체를 담지하는 표적 세포에 대한 결합에서 적어도 2-배, 적어도 3-배, 또는 적어도 4-배, 또는 적어도 5-배 또는 적어도 10-배 증가를 나타낸다. 암 세포 마커 또는 수용체에 친화성을 갖는 항체 단편의 경우, 암 세포 마커 또는 수용체는 분화 클러스터 19(CD19), 분화 클러스터 3(CD3), CD3d 분자(CD3D), CD3g 분자(CD3G), CD3e 분자(CD3E), CD247 분자(CD247 또는 CD3Z), CD8a 분자(CD8), CD7 분자(CD7), 막 메탈로엔도펩티다제(CD10), 막 스패닝 4-도메인 A1(CD20), CD22 분자(CD22), TNF 수용체 슈퍼패밀리 구성원 8(CD30), C-유형 렉틴 도메인 패밀리 12 구성원 A(CLL1), CD33 분자(CD33), CD34 분자(CD34), CD38 분자(CD38), 인테그린 서브유닛 알파 2b (CD41), CD44 분자(인도 혈액 군)(CD44), CD47 분자(CD47), 인테그린 알파 6(CD49f), 신경 세포 부착 분자 1(CD56), CD70 분자(CD70), CD74 분자(CD74), CD99 분자(Xg 혈액 군)(CD99), 인터루킨 3 수용체 서브유닛 알파(CD123), 프로미닌 1(CD133), 신데칸 1(CD138), 카보닉스 탈수효소 IX(CAIX), CC 케모카인 수용체 4(CCR4), ADAM 메탈로펩티다제 도메인 12(ADAM12), 부착 G 단백질-커플링된 수용체 E2(ADGRE2), 알칼리성 포스파타제 태반-유사 2(ALPPL2), 알파 4 인테그린, 안지오포이에틴-2(ANG2), B-세포 성숙 항원(BCMA), CD44V6, 암배아 항원(CEA), CEAC, CEA 세포 부착 분자 5(CEACAM5), 클라우딘 6(CLDN6), CLDN18, C-유형 렉틴 도메인 패밀리 12 구성원 A(CLEC12A), 중간엽-상피 전이 인자(cMET), 세포독성 T-림프구-연관된 단백질 4(CTLA4), 표피 성장 인자 수용체 1(EGF1R), 표피 성장 인자 수용체 변형체 III(EGFRvIII), 상피 당단백질 2(EGP-2), 상피 세포 부착 분자( EGP-40 또는 EpCAM), EPH 수용체 A2(EphA2), 엑토뉴클레오티드 피로포스파타제/포스포디에스테라제 3(ENPP3), erb-b2 수용체 티로신 키나제 2(ERBB2), erb-b2 수용체 티로신 키나제 3(ERBB3), erb-b2 수용체 티로신 키나제 4(ERBB4), 엽산 결합 단백질(FBP), 태아 니코틴성 아세틸콜린 수용체(AChR), 엽산 수용체 알파(Fralpha 또는 FOLR1), G 단백질-커플링된 수용체 143(GPR143), 글루타메이트 대사성 수용체 8(GRM8), 글리피칸-3(GPC3), 강글리오시드 GD2, 강글리오시드 GD3, 인간 표피 성장 인자 수용체 1(HER1), 인간 표피 성장 인자 수용체 2(HER2), 인간 표피 성장 인자 수용체 3(HER3),, 인테그린 B7, 세포간 세포-부착 분자-1(ICAM-1), 인간 텔로머라제 역전사효소(hTERT), 인터루킨-13 수용체 α2(IL-l3R-a2), K-경쇄, 키나제 삽입 도메인 수용체(KDR), 루이스-Y(LeY), 콘드로모듈린-1(LECT1), L1 세포 부착 분자(L1CAM), 리소포스파티드산 수용체 3(LPAR3), 흑색종-연관된 항원 1(MAGE-A1), 메조텔린(MSLN), 뮤신 1(MUC1), 뮤신 16, 세포 표면 연관(MUC16), 흑색종-연관된 항원 3(MAGEA3), 종양 단백질 p53(p53), T 세포에 의해 인식된 흑색종 항원 1(MART1), 당단백질 100(GPl00), 프로테이나제3(PR1), 에프린-A 수용체 2(EphA2), 자연 살해군 2D 리간드(NKG2D 리간드), 뉴욕 식도 편평 세포 암종 1(NY-ESO-1), 종양태아 항원(h5T4), 전립선-특이적 막 항원(PSMA), 프로그래밍된 사멸 리간드 1(PDL-1), 수용체 티로신 키나제-유사 희귀 수용체 1(ROR1), 영양막 당단백질(TPBG), 종양-연관된 당단백질 72(TAG-72), 종양-연관된 칼슘 신호 변환기 2(TROP-2), 티로시나제, 서바이빈, 혈관 내피 성장 인자 수용체 2(VEGF-R2), 윌름스 종양-1(WT-1), 백혈구 면역글로불린-유사 수용체 B2(LILRB2), 흑색종에서 우선적으로 발현된 항원(PRAME), T 세포 수용체 베타 불변 1(TRBC1), TRBC2 및 (T-세포 면역글로불린 뮤신-3) TIM-3을 포함할 수 있지만 이에 제한되지 않는다. 뉴런 수용체에 친화성을 갖는 항체 단편의 경우, 세포 마커 또는 수용체는 아드레날린성(예를 들어, α1A, α1b, α1c, α1d, α2a, α2b, α2c, α2d, β1, β2, β3), 도파민성(예를 들어, D1, D2, D3, D4, D5), GABA성(예를 들어, GABAA, GABAB1a, GABAB1δ, GABAB2, GABAC), 글루타민성(예를 들어, NMDA, AMPA, 카이네이트, mGluR1, mGluR2, mGluR3, mGluR4, mGluR5, mGluR6, mGluR7), 히스타민성(예를 들어, H1, H2, H3), 콜린성(예를 들어, 무스카린성(예를 들어, M1, M2, M3, M4, M5; 니코틴성(예를 들어, 근육, 뉴런(α-붕가로톡신-비민감성), 뉴런(α-붕가로톡신-민감성)), 오피오이드(예를 들어, μ, δ1, δ2, κ) 및 세로토닌성(예를 들어, 5-HT1A, 5-HT1B, 5-HT1D, 5-HT1E, 5-HT1F, 5-HT2A, 5-HT2B, 5-HT2C, 5-HT3, 5-HT4, 5-HT5, 5-HT6, 5-HT7)을 포함할 수 있지만 이에 제한되지 않는다.
일 실시형태에서, 항체 단편은 그의 생산 및 생산하는 숙주 세포로부터의 단리 후에 XDP에 접합된다. 또 다른 실시형태에서, 항체 단편은 XDP 시스템의 생산하는 숙주 세포에 의해 발현되는 XDP 캡시드의 일부로서 생산된다. 일부 경우에, 본 개시내용은 XDP 캡시드 또는 다른 XDP 성분을 인코딩하는 핵산에 작동가능하게 연결된 항체 단편을 인코딩하는 서열을 포함하는 핵산을 제공한다.
IV. XDP 시스템을 인코딩하는 핵산
또 다른 양태에서, 본 개시내용은 XDP 시스템의 성분을 인코딩하는 핵산과 혼입된 치료 페이로드, 및 핵산을 포함하는 벡터, 뿐만 아니라 핵산 및 벡터를 제조하는 방법에 관한 것이다.
일부 실시형태에서, 본 개시내용은 레트로바이러스-유래된 XDP 구조를 포함하는 성분 및 프로세싱 성분, 치료 페이로드 및 향성 인자를 인코딩하는 하나 이상의 핵산을 제공한다. 실시형태의 주요 구조적 성분 및 XDP 입자의 가공 및 어셈블리에 이용되는 핵산 및 벡터는 다양한 바이러스, 예컨대 레트로바이러스과 패밀리 구성원 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 스푸마레트로바이러스아과를 포함하지만 이에 제한되지 않는 레트로바이러스, 또는 렌티바이러스 예컨대 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV), 소 면역결핍 바이러스(BIV), 젬브라나병 바이러스(JDV), 말 감염성 빈혈 바이러스(EIAV), 염소 관절염 뇌염 바이러스(CAEV) 등으로부터 유래될 수 있다.
일부 실시형태에서, XDP 레트로바이러스 성분을 인코딩하는 핵산은 조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV)를 포함하지만 이에 제한되지 않는 알파레트로바이러스로부터 유래된다. 일부 실시형태에서, 본 개시내용은 매트릭스 폴리펩티드(MA); p2A 스페이서 펩티드; ap2B 스페이서 펩티드; p10 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2A, p2B, p10, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 인코딩하는 핵산을 제공한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, p2A, p2B, p10, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 비제한적으로 조류 백혈병 바이러스 및 라우스 육종 바이러스를 포함하는 알파레트로바이러스로부터 유래된다. 일부 실시형태에서, 알파레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 192, 193, 195, 196, 198-201, 782, 및 234, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 마우스 유방 종양 바이러스(MMTV), 메이슨-화이자 원숭이 바이러스(MPMV) 및 동물성 비강 종양 바이러스(ENTV)를 포함하나 이에 제한되지는 않는 베타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp21/24 스페이서 펩티드; p3-P8/p12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), pp21/24, p3-8/p12, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 상기 실시형태에서, Gag 성분(예를 들어, MA, CA, pp21/24 스페이서, p3-p8/p12 스페이서 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 마우스 유방 종양 바이러스, 메이슨-화이자 원숭이 바이러스 및 동물성 비강 종양 바이러스를 포함하지만 이에 제한되지 않는 베타레트로바이러스로부터 유래된다. 일부 실시형태에서, 베타레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열 235-257, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 소 백혈병 바이러스(BLV) 및 인간 T-림프영양성 바이러스(HTLV1)를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA),, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 소 백혈병 바이러스 및 인간 T-림프영양성 바이러스를 포함하지만 이에 제한되지 않는 델타레트로바이러스로부터 유래된다. 일부 실시형태에서, 델타레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열 서열번호: 258-272, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 Walleye 피부 육종 바이러스(WDSV), 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); p20 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p20, 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, p20, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 엡실론레트로바이러스로부터 유래된다. 일부 실시형태에서, 엡실론레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 273-277의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 뮤어라인 백혈병 바이러스(MLV), 말로니 뮤어라인 백혈병 바이러스(MMLV) 및 고양이 백혈병 바이러스(FLV)를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용을 인코딩하는 핵산은 XDP를 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); pp12 스페이서 펩티드; 캡시드 폴리펩티드(CA); 뉴클레오캡시드 폴리펩티드(NC); 매트릭스 폴리펩티드(MA), pp12 스페이서, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, pp12, CA 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 Walleye 피부 육종 바이러스 및 Walleye 표피 증식증 바이러스 1 및 2를 포함하지만 이에 제한되지 않는 감마레트로바이러스로부터 유래된다. 일부 실시형태에서, 감마레트로바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 278-287의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 HIV-1 및 HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 이러한 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 매트릭스 폴리펩티드(MA); 캡시드(CA), p2 스페이서 펩티드, 뉴클레오캡시드(NC), p1/p6 스페이서 펩티드; ); 매트릭스 폴리펩티드(MA), CA, P2, NC, 및 p1/p6을 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, NC, 및 p1/p6), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 HIV-1, HIV-2, 및 원숭이 면역결핍 바이러스(SIV)를 포함하지만 이에 제한되지 않는 렌티바이러스로부터 유래된다. 일부 실시형태에서, 렌티바이러스-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 288-312 및 334-339의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
일부 실시형태에서, XDP 바이러스 성분을 인코딩하는 핵산은 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 이러한 경우에, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP는 P68 Gag; p3 Gag; P68 Gag 및 p3 gag를 포함하는 Gag 폴리단백질; 치료 페이로드; 향성 인자; Gag-트랜스프레임 영역-Pol 프로테아제 폴리단백질; 프로테아제 절단 부위(들); 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로 구성된 군으로부터 선택된 성분을 포함한다. 전기한 실시형태에서, Gag 성분(예를 들어, MA, CA, p20, 및 NC), 및 선택적으로 프로테아제 절단 부위 및 프로테아제는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스를 포함하지만 이에 제한되지 않는 스푸마레트로바이러스아과로부터 유래된다. 일부 실시형태에서, 수마레트로바이러스아과-유래된 성분에 대한 인코딩 서열은 표 5에 제시된 서열번호: 313-333의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 일부 실시형태에서, 핵산은 CasX 및 gNA를 치료 페이로드로 묘사하는, 도 36-68에 묘사된 바와 같이 단락에 열거된 성분의 서브세트를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위에 대한 인코딩 뉴클레오티드는 각각의 개별 성분 사이에 위치한다. 다른 경우에, 프로테아제 절단 부위는 생략된다. 특정 실시형태에서, 단일 프로테아제 절단 부위에 대한 인코딩 서열은 뉴클레아제를 인코딩하는 서열과 연결된 레트로바이러스 성분 사이에 위치하며, 이는 TEV, PreScission 프로테아제, 또는 본 명세서에 개시된 다른 프로테아제 중 임의의 것에 의해 절단될 수 있는 것과 같은, 레트로바이러스 서열 또는 비-바이러스 서열일 수 있다. 대표적인 구성 및 서열은 실시예에 제시되어 있다. 특정 실시형태에서, 인코딩된 치료 페이로드는 본 명세서에 기재된 CasX 및 gNA 실시형태인 반면, 인코딩된 향성 인자는 본 명세서에 기재된 바이러스 당단백질 실시형태이다.
다른 실시형태에서, 본 개시내용은 XDP를 인코딩하는 핵산을 제공하며 여기서 XDP의 레트로바이러스 성분은 레트로바이러스과의 상이한 속으로부터 선택된다. 따라서 XDP를 인코딩하는 핵산은 매트릭스 폴리펩티드(MA), p2A 스페이서 펩티드, p2B 스페이서 펩티드; p10 스페이서 펩티드, 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), pp21/24 스페이서 펩티드, p3-p8 스페이서 펩티드, pp12 스페이서 펩티드, p20 스페이서 펩티드, p1/p6 스페이서 펩티드, p68 Gag, p3 Gag, 절단 부위(들), 및 프로테아제 절단 부위를 절단할 수 있는 프로테아제로부터 선택된 2개 이상의 성분을 포함할 수 있으며 여기서 성분은 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 렌티바이러스, 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스 중 2개 이상으로부터 유래된다.
HIV-1로부터 유래된 레트로바이러스 성분에서, 부가 단백질 인테그라제(또는 그의 인코딩 핵산)는 XDP 시스템 뿐만 아니라, 시험관내 바이러스 복제에 필수적인, HIV 기능적 보조 유전자 vpr, vpx(HIV-2)로부터 생략될 수 있다. 부가적으로, XDP 시스템의 핵산은 실시형태의 XDP 조성물의 생성을 위한 역전사효소를 필요로 하지 않는다. 따라서, 일 실시형태에서, XDP의 HIV-1 Gag-Pol 성분은, 이후 아래에 보다 완전하게 기술된 Gag-TFR-PR로 지칭되는, 프로테아제 절단 부위에 의해 분리된, 트랜스프레임 옥타펩티드(TFP) 및 p6pol의 48개 아미노산으로 구성된 트랜스프레임 영역(TFR)에 연결된 Gag로 끝이 절단될 수 있다.
[표 5]: DNA 서열을 인코딩하는 레트로바이러스 구조적 구성요소
* 야생형 서열(구성에 따라 선택적으로 합체됨)
일부 실시형태에서, 본 개시내용은 XDP의 표면에 합체되고 그 위에 표시되는 향성 인자에 대한 서열을 인코딩하는 핵산을 제공하며, 여기서 향성 인자는 표적 세포 또는 조직의 막과 결합하고 융합하는 XDP의 증가된 능력을 부여한다. 일 실시형태에서, 향성 인자는 당단백질이며, 여기서 인코딩 핵산은 표 4의 서열, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열로 구성된 군으로부터 선택된다. 또 다른 실시형태에서, 개시내용은 항체 단편을 인코딩하는 핵산을 제공하며, 여기서 항체 단편은 표적 세포 또는 조직 상의 표적 세포 마커 또는 수용체에 대해 특이적 결합 친화성을 갖는다. 또 다른 실시형태에서, 개시내용은 세포 수용체를 인코딩하는 핵산을 제공하며, 여기서 세포 수용체는 표적 세포 또는 조직 상의 표적 세포 마커에 대해 특이적 결합 친화성을 갖는다. 또 다른 실시형태에서, 개시내용은 리간드를 인코딩하는 핵산을 제공하며, 여기서 리간드는 표적 세포 또는 조직 상의 표적 세포 마커 또는 수용체에 대해 특이적 결합 친화성을 갖는다. 향성 인자를 인코딩하는 핵산의 함입에 의해, 생성된 XDP가 표적 세포 또는 조직에 대한 선택성을 증가시켜, 증가된 치료 지수와 감소된 표적-외 효과를 초래할 것이다는 것을 이해할 것이다.
본 개시내용은 XDP 안으로 합체된 치료 페이로드를 인코딩하거나 포함하는 핵산을 추가로 제공한다. 예시적인 치료 페이로드는 상기에서 본 명세서에 기술되었다. 일부 실시형태에서, XDP의 치료 페이로드는 CRISPR 뉴클레아제 및 하나 이상의 가이드 RNA이다. 전기한 것의 특정 실시형태에서, 개시내용은 표 1의 CasX 뉴클레아제를 인코딩하는 핵산, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 제공한다. 이러한 핵산의 대표적인 예는 서열번호: 354, 340-342, 346-349, 378-387 및 426-431의 핵산을 개시하는 실시예의 표 6-8, 11 및 16에 제시되어 있다. 전기한 것의 또 다른 특정 실시형태에서, 개시내용은 표 3에 제시된 서열번호: 597-781의 gNA 변이체를 인코딩하는 핵산, 또는 여기에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 동일성을 갖는 서열을 제공하고, 여기서 gNA는 표적 핵산에 상보적인 표적화 서열을 추가로 포함한다.
개시내용의 일부 실시형태에서, XDP 시스템의 성분은 1개, 2개, 3개, 4개, 5개 또는 그 초과의 핵산에 의해 인코딩되며(대표적인 플라스미드 및 XDP 구성의 개략도인 도 36-68 참고), 이는 진핵 세포에서 작동가능하고 발현되는 구성요소에 적합한 조절 요소에 (그의 제어 하에서) 작동가능하게 연결되어 있는 단일 구성요소 또는 다중 구성요소를 인코딩할 수 있다. XDP 시스템 구성의 설명에서 조절 요소, 절단 서열 등의 배치를 이용하기 위해 핵산 내에 인코딩된 구성요소의 절대 순서가 변경될 수 있어, 각 구성요소가 당업계의 통상인에 의해 이해되는 바와 같이 최적의 양식으로 XDP의 어셈블리에서 발현 및/또는 활용될 수 있다는 것을 이해할 것이다. 예를 들어, 핵산이 Gag 폴리단백질, 치료 페이로드 및 프로테아제 절단 부위를 인코딩하는 경우, 순서(5'에서 3')는 Gag-절단 부위-치료 페이로드일 수 있거나 또는 치료 페이로드-절단 부위-gag일 수 있고, 단일 핵산에 인코딩된 구성요소의 임의의 조합에 대해서도 동일하게 적용되는 것이 의도된다. 대표적인 조절 요소가 본 명세서에 기술되어 있다.
일부 실시형태에서, 개시내용은 레트로바이러스 Gag 폴리단백질(이의 전부 또는 일부), 프로테아제 절단 부위, 치료 페이로드, Gag-Pol 폴리단백질 및 향성 인자 중 둘 이상으로부터 선택된 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개, 3개 또는 4개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 제1 핵산은 Gag 폴리단백질(또는 이의 일부) 및, 선택적으로, 2개 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 Gag-Pol 폴리단백질(또는 이의 일부), 향성 인자 및 gNA를 인코딩한다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질(또는 이의 일부) 및, 선택적으로, 2개 구성요소를 분리하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 Gag-Pol 폴리단백질을 인코딩하고, 제3 핵산은 향성 인자 및 gNA를 인코딩한다. 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질(또는 이의 일부) 및, 선택적으로, 2개의 구성요소를 분리하는 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 Gag-Pol 폴리단백질(또는 이의 일부)을 인코딩하고, 그리고 제4 핵산은 gNA를 인코딩한다. 일부 경우에, 프로테아제 절단 부위는 생략된다. 다른 경우에, 프로테아제 절단 부위는 Gag 폴리단백질의 각 구성요소와, 선택적으로, 치료 페이로드 사이에 위치한다. 전기한 실시형태의 인코딩 핵산의 대표적인 예가 실시예에 제시되어 있다.
다른 실시형태에서, 개시내용은 Gag-TFR-PR 폴리단백질(또는 이의 일부), 프로테아제 절단 부위, 치료 페이로드로서의 CasX 단백질, gNA, 및 향성 인자를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag-TFR-PR 폴리단백질 및 2개의 구성요소를 분리하는 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자 및 gNA를 인코딩한다. 또 다른 실시형태에서, 제1 핵산은 Gag-TFR-PR 폴리단백질 및 2개의 구성요소를 분리하는 개재하는 프로테아제 절단 부위를 갖는 치료 페이로드로서 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA를 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 절단 부위는 Gag 폴리단백질의 각 구성요소와, 선택적으로 CasX 단백질 사이에 위치한다. 전기한 실시형태의 인코딩 핵산의 대표적인 예가 실시예에 제시되어 있다(표 16, 17, 19, 20, 22, 23, 24, 27, 30, 33 및 36 및 그 안에 포함된 서열 참고).
다른 실시형태에서, 개시내용은 Gag 폴리단백질(또는 이의 일부), 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 향성 인자를 포함하는 XDP 시스템의 성분을 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질, 프로테아제, CasX 단백질, 및 구성요소 사이에 위치한 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩한다. 전기한 것의 또 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질, 프로테아제, CasX 단백질 및 구성요소 사이의 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고; 그리고 제3 핵산은 하나 이상의 gNA를 인코딩한다.
다른 실시형태에서, 개시내용은 Gag-Pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 향성 인자를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 경우에, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하고, 제2 핵산은 향성 인자, gNA 및 RNA 결합 도메인을 인코딩한다. 전기한 것의 또 다른 경우에서, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩한다.
일부 실시형태에서, 개시내용은 Gag-Pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 향성 인자, 및 gNA를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개 또는 3개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 또 다른 경우에, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하는 제1 핵산을 인코딩하고, 제2 핵산은 향성 인자 및 gNA를 인코딩한다. 다른 경우에, 제1 핵산은 Gag-Pol 폴리단백질 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA를 인코딩한다.
다른 실시형태에서, 개시내용은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 향성 인자를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 1개, 2개, 3개 또는 4개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 구성요소는 단일 핵산 상에서 인코딩된다. 전기한 것의 다른 경우에, 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 3개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 인코딩하는 제1 핵산을 인코딩하고, 제2 핵산은 향성 인자 및 gNA를 인코딩한다. 다른 경우에, 제1 핵산은 MA, CasX 단백질 프로테아제, 및 3개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고; 제3 핵산은 gNA를 인코딩한다. 다른 경우에, 제1 핵산은 MA 및 두 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질을 인코딩하고, 제2 핵산은 향성 인자를 인코딩하고, 제3 핵산은 gNA를 인코딩하고, 제4 핵산은 프로테아제를 인코딩한다. 전기한 실시형태에서, 제1 핵산은 추가의 개재하는 프로테아제 절단 부위에 의해 MA에 연결된 CA 구성요소를 추가로 코딩할 수 있다. 전기한 것의 일부 실시형태에서, 프로테아제 및 프로테아제 절단 부위는 생략된다.
일부 실시형태에서, 개시내용은 Gag 폴리단백질(이의 전부 또는 일부), CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 향성 인자, 및 Gag-Pol 폴리단백질(이의 전부 또는 일부)를 포함하는 XDP 시스템의 구성요소를 인코딩하는 서열을 포함하는 핵산을 제공하며, 여기서 구성요소는 2개, 3개 또는 4개의 개별 핵산 상에서 인코딩된다. 전기한 것의 일부 실시형태에서, 제1 핵산은 Gag 폴리단백질, CasX 단백질, 프로테아제, 및 3개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 인코딩하고, 제2 핵산은 Gag-Pol 폴리단백질, 향성 인자, 및 gNA를 인코딩한다. 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질 및 2개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질을 인코딩하고, 제2 핵산은 프로테아제를 인코딩하고, 제3 핵산은 향성 인자, gNA 및 Gag-Pol 폴리단백질을 인코딩한다. 다른 실시형태에서, 제1 핵산은 Gag 폴리단백질 및 2개의 구성요소 사이에 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질을 인코딩하고, 제2 핵산은 프로테아제를 인코딩하고, 제3 핵산은 향성 인자를 인코딩하고, 제4 핵산은 gNA 및 Gag-Pol 폴리단백질을 인코딩한다. 전기한 것의 일부 실시형태에서, 프로테아제 및 프로테아제 절단 부위는 생략된다.
다른 실시형태에서, XDP 시스템은 표 16, 17, 19, 20, 22, 23, 24, 27, 30, 33, 또는 36에 제시된 서열번호: 426-436, 784-823, 828-873, 880-933, 947-1009의 핵산 서열, 또는 여기에 적어도 약 80%, 적어도 약 90%, 적어도 약 95%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 적어도 약 99% 서열 동일성을 갖는 서열로 구성된 군으로부터 선택된 서열의 일부 또는 전부에 의해 인코딩된다.
일부 실시형태에서, 본 명세서에 기재된 임의의 실시형태의 XDP 시스템을 인코딩하는 핵산은 공여자 주형 핵산을 추가로 포함하며 여기서 공여자 주형은 돌연변이를 교정하거나 유전자를 녹-다운 또는 녹-아웃하기 위해 표적 핵산 안으로 삽입되는 서열을 포함한다. 일부 실시형태에서, 공여자 주형 서열은 표적 핵산의 절단 부위에 대해 상동성 5' 및 3'의 2개 영역(즉, 상동성 암)에 의해 측접된 비-상동성 서열을 포함하여, HDR 또는 HITI에 의해 매개될 수 있는 표적 영역에서 비-상동성 서열의 삽입을 용이하게 한다. HITI에 의해 삽입된 외인성 공여자 주형은 임의의 길이, 예를 들어 1 내지 50개 뉴클레오티드 길이의 비교적 짧은 서열, 또는 약 50-1000개 뉴클레오티드 길이의 보다 긴 서열일 수 있다. 상동성의 결여는 예를 들어 20-50% 이하의 서열 동일성을 갖고/갖거나 낮은 엄격도에서 특이적 혼성화가 결여될 수 있다. 다른 경우에, 상동성의 결여는 5, 6, 7, 8, 또는 9bp 이하의 동일성을 갖는 기준을 추가로 포함할 수 있다. 그러한 경우에, 상동성 암의 사용은 뉴클레아제에 의해 도입된 절단 부위(들)에서 비-상동성 서열의 삽입을 용이하게 한다. 일부 실시형태에서, 공여자 주형 폴리뉴클레오티드는 적어도 약 10, 적어도 약 50, 적어도 약 100, 또는 적어도 약 200, 또는 적어도 약 300, 또는 적어도 약 400, 또는 적어도 약 500, 또는 적어도 약 600, 또는 적어도 약 700, 또는 적어도 약 800, 또는 적어도 약 900, 또는 적어도 약 1000, 또는 적어도 약 10,000, 또는 적어도 약 15,000 뉴클레오티드를 포함한다. 다른 실시형태에서, 공여자 주형은 적어도 약 10 내지 약 15,000 뉴클레오티드, 또는 적어도 약 100 내지 약 10,000 뉴클레오티드, 또는 적어도 약 400 내지 약 8,000 뉴클레오티드, 또는 적어도 약 600 내지 약 5000 뉴클레오티드, 또는 적어도 약 1000 내지 약 2000 뉴클레오티드를 포함한다. 공여자 주형 서열은 게놈 서열과 비교하여 특정 서열 차이; 예를 들어 제한 부위, 뉴클레오티드 다형성, 선택가능한 마커(예를 들어, 약물 내성 유전자, 형광 단백질, 효소 등) 등을 포함할 수 있으며, 이는 절단 부위에서 공여자 핵산의 성공적인 삽입을 평가하는 데 사용될 수 있거나 또는 일부 경우에 다른 목적으로 사용될 수 있다(예를 들어, 표적화된 게놈 유전자좌에서 발현을 나타내기 위함). 대안적으로, 이들 서열 차이는 마커 서열의 제거를 위해 나중에 활성화될 수 있는 FLP, loxP 서열 등과 같은 측접하는 재조합 서열을 포함할 수 있다. 또 다른 실시형태에서, 공여자 주형은 표적 유전자의 적어도 일부를 인코딩하는 핵산을 포함하며 여기서 공여자 주형 핵산은 돌연변이를 포함하는 표적 유전자와 비교하여 야생형 서열의 전부 또는 일부를 포함하고, 여기서 공여자 주형은 유전자 편집 과정 동안 HDR에 의해 세포의 표적 핵산 내에 삽입된다. 이러한 경우에 표적 핵산 내에 삽입시 기능적 유전자 산물이 발현될 수 있도록 표적 유전자를 교정한다. 일부 실시형태에서, 공여자 주형은 10-10,000개 뉴클레오티드의 크기 범위이다. 다른 실시형태에서, 공여자 주형은 100-1,000개 뉴클레오티드의 크기 범위이다. 일부 실시형태에서, 공여자 주형은 단일-가닥 DNA 주형 또는 단일 가닥 RNA 주형이다. 다른 실시형태에서, 공여자 주형은 이중-가닥 DNA 주형이다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 XDP 시스템의 제1 핵산에 혼입된다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 제2 핵산에 혼입된다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 제3 핵산에 혼입된다. XDP 시스템의 또 다른 실시형태에서, 공여자 주형 핵산은 제4 또는 제5 핵산에 혼입된다.
일부 실시형태에서, 각각의 개별 핵산은 진핵 패키징 세포 내로의 형질감염에 적합한 플라스미드 벡터 내로 혼입되고, 그 예는 하기에 보다 완전하게 기재되어 있어 XDP 시스템이 도 36-68에 묘사된 바와 같이 1, 2, 3, 4 또는 5개 플라스미드를 포함할 것이다. 각각의 경우에, XDP 시스템의 구성요소를 인코딩하는 뉴클레오티드 서열은 진핵 세포에서 조작가능하고 발현되는 구성요소에 적합한 조절 요소에 (그의 제어 하에서) 작동가능하게 연결된다. 예시적인 조절 요소는 전사 프로모터(예를 들어, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, MMLV-ltr 및 메탈로티오네인), 전사 인핸서 요소, 전사 종결 신호, 단일 전사체로부터 다중 유전자의 번역을 허용하는 내부 리보솜 진입 부위(IRES) 또는 p2A 펩티드, 다운스트림 전사 종결을 촉진하는 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 일부 경우에 프로모터는 CMV 프로모터, CAGG, PGK, U6(shRNA를 합성하는 RNA pol III의 경우), 신장 인자 1 알파(EF1-알파) 또는 H1과 같은 구성적 프로모터이다. 일 실시형태에서, 인간 사이토메갈로바이러스 즉시 초기(HCMV-IE) 인핸서/프로모터와 같은 구성적 프로모터는 tat에 의해 정상적으로 제공되는 전사의 조절을 보상하기 위해 사용된다. 다른 경우에, 프로모터는 유도성 프로모터 예컨대, 이에 제한되지는 않지만, T7 RNA 폴리머라제 프로모터, T3 RNA 폴리머라제 프로모터, 이소프로필-베타-D-티오갈락토피라노사이드(IPTG)-조절된 프로모터, 열 충격 프로모터, 또는 테트라사이클린-조절된 프로모터(TRE), 또는 음성 유도성 pLac 프로모터일 수 있다. 당업자에게 공지된 임의의 강력한 프로모터가 핵산의 발현을 유도하기 위해 사용될 수 있다. 렌티바이러스 패키징 구성요소를 인코딩하는 핵산의 경우, 벡터는 psPax2(실시예에서 자세히 설명됨, 서열번호: 430) 또는 pMDLg/pRRE 플라스미드일 수 있다. VSV-G 위형화 바이러스 외피 당단백질을 인코딩하는 핵산의 경우, 벡터는 pMD2.G 플라스미드일 수 있다.
실시형태의 벡터는 또한 예를 들어 CasX 서열과 같은 치료 페이로드의 다운스트림일 수 있는 폴리아데닐화 신호를 포함할 수 있다. 폴리아데닐화 신호는 SV40 폴리아데닐화 신호, LTR 폴리아데닐화 신호, 소 성장 호르몬(bGH) 폴리아데닐화 신호, 인간 성장 호르몬(hGH) 폴리아데닐화 신호, 또는 인간 -글로빈 폴리아데닐화 신호일 수 있다. SV40 폴리아데닐화 신호는 pCEP4 벡터(Invitrogen, 캘리포니아주 샌디에고 소재)로부터의 폴리아데닐화 신호일 수 있다.
실시형태의 벡터는 또한 CasX 서열 또는 gNA 서열과 같은 치료 페이로드의 업스트림에 인핸서를 포함할 수 있다. 인핸서는 DNA 발현에 필요할 수 있다. 인핸서는 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴 또는 CMV, HA, RSV 또는 EBV로부터의 것과 같은 바이러스 인핸서일 수 있다. 폴리뉴클레오티드 기능 인핸서는 미국 특허 번호 5,593,972, 5,962,428 및 WO94/016737에 기술되어 있으며, 각각의 내용은 참고로 완전히 포함된다. 벡터는 또한 벡터를 염색체외로 유지하고 세포에서 벡터의 다중 카피를 생성하기 위해 포유동물 복제 기점을 포함할 수 있다. 벡터는 또한 벡터가 투여되는 포유동물 또는 인간 세포에서 유전자 발현에 매우 적합할 수 있는 조절 요소를 포함할 수 있다. 벡터는 또한 녹색 형광 단백질("GFP")과 같은 리포터 유전자 및/또는 하이그로마이신("Hygro")과 같은 선택가능한 마커를 포함할 수 있다.
HIV-기반 벡터의 사용을 포함하는 실시형태에서, 벡터는 바이러스 단백질의 복제를 보조하는 인자 또는 부속 단백질을 인코딩하는 추가 서열을 포함할 수 있다. 일 실시형태에서, HIV-기반 벡터는 RNA 폴리머라제 II의 활성화에 관여하고 전사 및 번역을 자극하는 단백질인 tat를 인코딩하는 서열을 포함한다(Das, A., 등 The HIV-1 Tat Protein Has a Versatile Role in Activating Viral Transcription. J Virol. 85(18): 9506 (2011)). 또 다른 실시형태에서, HIV-기반 벡터는 인트론-함유 HIV-1 RNA의 핵 유출에 중요한 RNA 결합 단백질인 Rev를 인코딩하는 서열을 포함한다(Pollard, V., 등 The HIV-1 Rev protein. Ann Rev Microbiol. 52:491 (1998)). 또 다른 실시형태에서, HIV-기반 벡터는 유비퀴틴화 및 세포 분해를 위해 표적화함에 의해 포유동물 효소 APOBEC의 항바이러스 활성을 파괴하는 바이러스 복제에 필수적인 부속 단백질인 바이러스 감염성 인자(Vif)를 인코딩하는 서열을 포함한다(Yang, G., 등 Viral infectivity factor: a novel therapeutic strategy to block HIV-1 replication. Minireviw Med Chem 13(7):1047 (2013)). 또 다른 실시형태에서, HIV-기반 벡터는 숙주 세포 제한 인자의 항바이러스 활성을 억제할 뿐만 아니라 감염된 세포로부터 바이러스 입자의 효율적인 방출에 필수적인 부속 단백질인 바이러스 단백질 U(Vpu)를 인코딩하는 서열을 포함한다(Gonzlez, M. Vpu Protein: The Viroporin Encoded by HIV-1. Viruses 7:4352 (2015). 또 다른 실시형태에서, HIV-기반 벡터는 숙주 적응성 세포-매개된 면역을 회피하는 것뿐만 아니라 표적 세포에서 감염성을 고양하는데 필수적인 부속 단백질인 음성 인자(Nef)를 인코딩하는 서열을 포함한다(Basmaciogullari, S., 등 The activity of Nef on HIV-1 infectivity. Frontiers Microbiol 5:232 (2014). 또 다른 실시형태에서, HIV-기반 벡터는 숙주 항-바이러스 경로를 제한하는 잠재적 역할에 부가하여 바이러스 복제에 영향을 미치는 다수의 세포 단백질과의 그 상호작용에 중요한 부속 단백질인 바이러스 단백질 R(VpR)을 인코딩하는 서열을 포함한다(Zhao, Richard Y, and Michael I Bukrinsky. HIV-1 accessory proteins: VpR. Methods Mol Biol 1087:125 (2014). 일부 실시형태에서, HIV-기반 벡터는 tat, Vif, Rev, Vpu, Nef 및 VpR의 임의의 조합을 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), p1/p6 폴리펩티드 및 CasX 폴리펩티드를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 프로테아제(PRO), 역전사효소(RT) 및 인테그라제(INT)에 작동가능하게 연결된, 5'에서 3'으로 MA, CA, p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, CasX 및 PRO를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), p1/p6 폴리펩티드 및 CasX 폴리펩티드를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 CasX 폴리펩티드 및 PRO에 작동가능하게 연결된, 5'에서 3'으로 MA, CA, NC, p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC, p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 5'에서 3'으로 MA, CA, NC 및 p1/p6을 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, NC, CasX, 및 p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, CasX, 및 p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CasX, 및 p1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, tev 절단 서열(TCS), 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, TCS 및 TEV 프로테아제(TEV)를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, TCS, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PreScission 절단 서열(PCS) 및 PreScission 프로테아제(PSP)를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, TCS, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 PreScission 프로테아제(PSP)를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 PSP를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, PCS 및 TEV를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, P1 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, NC, CasX 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CA, CasX 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CasX, NC, 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO에 작동가능하게 연결된, MA, CasX 및 P1/p6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, NC, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, CasX 및 PRO를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, CA, NC, 및 p1/p6을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, 알파레트로바이러스 gag 폴리단백질 성분 P2A, P2B 및 P10, 뿐만 아니라 CA, NC, PRO 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, pp21/24, P12/P3/P8, CA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA, NC, PRO, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA, NC, PRO, 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC, P6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, p68-Gag를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA, NC, PRO 및 CasX를 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp21/24, P12/P3/P8, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp21/24, P12/P3/P8, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, pp21/24, P12/P3/P8, CA, NC를 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, p20, CA, NC를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 5'에서 3'으로 MA, pp12, CA, NC, PRO 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, MA, CA, NC, P6을 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5' 내지 3', p68-Gag, p3-Gag 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 4개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 p68-Gag, p3-Gag 및 CasX를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제2 핵산은, 예를 들어 리보솜 프레임시프트에 의해 PRO 및 CasX에 작동가능하게 연결된, p68-Gag, p3-Gag를 인코딩하는 서열을 5'에서 3'으로 포함한다. 일부 실시형태에서, 제3 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제4 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, P2A, P2B, P10, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp21/24, P12/P3/P8, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, pp12, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, p20, CA, NC 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, p1/p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, p1/p6, p1/p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, CasX 및 p1/p6을 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
일부 실시형태에서, 개시내용의 XDP 시스템은 3개의 핵산을 포함한다. 일부 실시형태에서, 제1 핵산은 5'에서 3'으로 MA, CA, NC, P2, p1/p6 및 CasX를 포함한다. 일부 실시형태에서, 제2 핵산은 당단백질, 예를 들어 VSV-G를 인코딩하는 서열을 포함한다. 일부 실시형태에서, 제3 핵산은 gNA를 인코딩하는 서열을 포함한다.
전기한 것 중 임의의 것에서, 임의의 성분이 프로테아제 절단 부위, 자가-절단 폴리펩티드, 또는 내부 리보솜 진입 부위, 또는 이의 임의의 조합을 인코딩하는 서열에 의해 분리될 수 있다.
V. XDP 패키징 세포
또 다른 양태에서, 본 개시내용은 XDP의 생산에 이용되는 패키징 세포에 관한 것이다. 본 명세서에 사용된 바와 같이, 용어 "패키징 세포"는 패키징 신호를 함유하지 않지만 XDP 입자의 올바른 패키징에 필요한 또는 유용한 바이러스 구조 단백질 및 복제 효소(예를 들어, Gag, pol 등)를 안정적으로 또는 일시적으로 발현하는 세포주와 관련하여 사용된다. 실시형태에서, 세포주는 (개별 유기체로부터의) 1차 생체외 배양된 세포 뿐만 아니라 확립된 세포주를 포함하는, XDP의 생산에 적합한 임의의 세포주일 수 있다. 세포 유형은 박테리아 세포, 효모 세포 및 포유동물 세포를 포함할 수 있다. 예시적인 박테리아 세포 유형은 대장균을 포함할 수 있다. 예시적인 효모 세포 유형은 사카로마이세스 세레비지애를 포함할 수 있다. 스포돕테라 프루기페르다 sf9 세포와 같은 곤충 세포주도 패키징 세포로 사용하기에 적합하다. 예시적인 포유동물 세포 유형은 마우스, 햄스터 및 인간 1차 세포, 뿐만 아니라 세포주 예컨대 인간 배아 신장 293(HEK293) 세포, Lenti-X 293T 세포, 베이비 햄스터 신장(BHK) 세포, HepG2 세포, Saos-2 세포, HuH7 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO 세포, NIH3T3 세포, COS 세포, WI38 세포, MRC5 세포, A549 세포, HeLa 세포, 차이니즈 햄스터 난소(CHO) 세포, 또는 HT1080 세포를 포함할 수 있다. 세포 유형에 대한 적절한 벡터의 선택은 당업자에게 용이하게 명백할 것이다. 일부 실시형태에서, 진핵 세포는 XDP 내로 합체될 수 있는 세포 표면 마커의 발현을 감소시키기 위해 하나 이상의 돌연변이 하나 이상의 돌연변이에 의해 변형된다. 그러한 마커는 MHC 수용체에 의해 결합될 수 있거나 그렇지 않으면 대상체에서 면역 반응을 촉발할 수 있는 수용체 또는 단백질을 포함할 수 있다.
XDP 시스템의 실시형태에서, 벡터는 특정 치료 페이로드(예를 들어, 표적 핵산을 편집하기 위해 설계된 CasX:gNA) 뿐만 아니라, 상기에서 상세히 설명된 다른 바이러스-유래된 구조 성분(예를 들어, Gag 폴리단백질, pol 폴리단백질, 향성 인자, 및 선택적으로 공여자 주형 핵산 서열)을 인코딩하는 패키징 세포 내로 도입된다. 벡터는 염색체-외 요소로 남을 수 있거나 일부 또는 전부가 숙주 세포 염색체 DNA 내에 합체되어 안정적으로-형질전환된 패키징 세포를 생성할 수 있다.
일부 실시형태에서, XDP 시스템의 핵산을 포함하는 벡터는 형질감염, 형질도입, 리포펙션 또는 전기천공을 통해 세포 내로 도입되어 패키징 세포주를 생성한다. 벡터의 도입은 Qiagen으로부터 상업적으로 이용가능한 TransMessenger 시약, Stemgent로부터 Stemfect RNA Transfection Kit, 및 Mirus Bio LLC로부터 TransIT-mRNA Transfection Kit, Lonza 뉴클레오펙션, Maxagen 전기천공 등의 하나 이상을 사용할 수 있다. 형질감염, 형질도입 또는 감염을 위한 방법은 당업자에게 잘 알려져 있다.
일부 경우에, 패키징 벡터는 neo, DHFR, Gln 합성효소 또는 ADA와 같은 우성 선별 마커와 함께 세포 내로 도입된 다음 적절한 약물 존재 하에 선별 및 클론의 분리가 뒤따른다. 선별 마커 유전자는 패키징 벡터에 의해 인코딩되는 유전자에 물리적으로 연결될 수 있다.
형질감염된 숙주 세포로부터의 캡슐화된 치료 페이로드를 갖는 XDP의 어셈블리 및 방출은 바이러스 구조 단백질인 Gag에 의해 매개될 수 있다. 인간 면역결핍 바이러스 유형 1(HIV-1) Gag는 전구체 폴리단백질인 Pr55gag로 합성된다. 이 폴리단백질은 4개의 주요 구조 도메인으로 구성되며, 이는 바이러스 프로테아제에 의해 출아 과정 동안 또는 직후에 p17 매트릭스(MA), p24 캡시드(CA), p7 뉴클레오캡시드(NC) 및 p6으로 절단된다(Adamson CS., and Freed EO. Human immunodeficiency virus type 1 assembly, release, and maturation. Adv. Pharmacol. 55:347 (2007)). HIV-1 시스템을 활용하면 세포로부터 XDP의 효율적인 생산을 할 수 있도록 하는 것은 p55 Gag 단백질을 발현하는 것으로 충분하다(Gheysen 등, Assembly and release of HIV-1 precursor Pr55Gag virus-like particles from recombinant baculovirus-infected insect cells. Cell. 59(1):103 (1989)). 절단되지 않은 Pr55Gag의 맥락에서, MA는 Gag 단백질의 N-말단 도메인을 구성하고 원형질막에 대한 Gag 전구체의 막 결합 및 국소화에 필수적이다. CA 및 NC 도메인은 각각 직접적인 단백질-단백질 상호작용 및 간접적인 RNA-매개된 상호작용을 통해 Gag 다량체화를 촉진한다. p6 내에 후기 도메인 모티프의 함입은 세포 표면에서 XDP 입자의 방출을 촉진할 수 있다. 발현 시 Gag 폴리펩티드는 세포막을 표적화하고 막 출아 동안 XDP에 합체된다. 숙주 세포로부터 바이러스 출아 동안 또는 직후에 HIV-1 프로테아제는 Pr55gag를 성숙한 Gag 단백질 p17 매트릭스(MA), p24 캡시드(CA), p7 뉴클레오캡시드(NC) 및 p6으로 절단한다. Gag의 단백질분해 처리는 XDP 구조에서 주요한 변형을 초래한다: MA는 바이러스 막의 내부 면과 연관된 상태로 유지되는 반면 CA는 응축되어 NC 복합체(합체된 경우) 주위에 쉘을 형성한다. 이 재배열은 감염성 비리온과 유사한 원추형 코어 특성을 가진 입자로 형태학적 전환을 생성한다.
부분적으로 레트로바이러스로부터 유래된 성분이 표적 세포로의 치료 페이로드의 전달을 위한 패키징 세포 내에서 XDP를 생성하기 위해 이용될 수 있다는 것이 발견되었다. 일 실시형태에서, XDP 시스템 플라스미드로 형질전환된 패키징 세포는 표적 핵산의 편집을 수행하기 위해 CasX:gNA 시스템의 캡슐화된 RNP를 세포로 전달하는 것을 촉진하는 XDP를 생성한다.
VI. XDP 발현 시스템 및 XDP를 생산하는 방법
또 다른 양태에서, 본 개시내용은 선택된 숙주 세포에서 발현과 양립가능한 조절 요소에 작동가능하게 연결된 본 명세서에 기재된 XDP 시스템의 핵산을 포함하는 발현 카세트를 포함하는, 선택된 숙주 패키징 세포에서 XDP의 생산에 사용하기 위한 재조합 발현 시스템을 제공한다. 발현 카세트는 본 명세서 및 실시예에 기재된 바와 같은 하나 이상의 벡터에 포함될 수 있고, 동일하거나 상이한 프로모터를 사용할 수 있다. 예시적인 조절 요소는 전사 프로모터 예컨대, 비제한적으로, CMV, CMV+인트론 A, SV40, RSV, HIV-Ltr, 신장 인자 1 알파(EF1α), MMLV-ltr, 단일 전사체로부터 다중 유전자의 번역을 허용하는 내부 리보솜 진입 부위(IRES) 또는 p2A 펩티드, 메탈로티오네인, 전사 인핸서 요소, 전사 종결 신호, 폴리아데닐화 서열, 번역 개시의 최적화를 위한 서열, 및 번역 종결 서열을 포함한다. 적절한 제어 요소의 선택은 발현되는 인코딩된 성분(예를 들어, 단백질 또는 RNA) 또는 핵산이 상이한 폴리머라제를 필요로 하거나 융합 단백질로 발현되도록 의도되지 않는 다중 성분을 포함하는지 여부에 따라 달라진다는 것이 이해될 것이다.
일부 실시형태에서, 본 개시내용은 치료 페이로드(예를 들어, CasX 단백질 및 gNA의 RNP)를 포함하는 XDP를 제조하는 방법을 제공하며, 상기 방법은 XDP가 캡슐화된 치료 페이로드로 생성된 다음, 하기 또는 실시예에 기재된 패키징 세포에 의해 생성된 XDP를 수확하도록 하는 조건 하에서 본 명세서에 기재된 실시형태 중 임의의 하나의 XDP 시스템을 인코딩하는 발현 카세트 또는 합체된 핵산을 포함하는 본 명세서에 기재된 실시형태의 패키징 세포를 증식시키는 것을 포함한다. 일부 실시형태에서, 패키징 세포는 CasX 및 gNA의 RNP, 및 선택적으로 HDR에 의한 표적 핵산의 편집을 위한 공여자 주형을 포함하는 XDP를 생산한다.
패키징 세포는, 예를 들어, 포유동물 세포(예를 들어, HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2 세포, Saos-2 세포, HuH7 세포, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO 세포, NIH3T3 세포, COS 세포, WI38 세포, MRC5 세포, A549 세포, HeLa 세포, CHO 세포 및 HT1080 세포), 곤충 세포(예를 들어, Trichoplusia ni(Tn5) 또는 Sf9), 박테리아 세포, 식물 세포, 효모 세포, 항원 제시 세포(예를 들어, 일차, 불멸화 또는 종양-유래된 림프 세포 예컨대 대식세포, 단핵구, 수지상 세포, B-세포, T-세포, 줄기 세포, 및 이의 전구 세포)일 수 있다. 패키징 세포는 전기천공법, 양이온성 중합체의 사용, 인산칼슘, 바이러스-매개된 형질감염, 형질도입 또는 리포펙션을 포함한 통상적인 방법으로 형질감염될 수 있다. 일부 실시형태에서, 패키징 세포는 그렇지 않으면 XDP 내에 합체될 세포 표면 마커 또는 수용체를 감소 또는 제거하여 XDP의 투여를 받는 대상체에 의한 세포 표면 마커 또는 수용체에 대한 면역 반응을 감소시키도록 변형될 수 있다.
패키징 세포 내로 벡터의 도입은 Qiagen으로부터 상업적으로 이용가능한 TransMessenger 시약, Stemgent로부터 Stemfect RNA Transfection Kit, 및 Mirus Bio LLC로부터 TransIT-mRNA Transfection Kit, Lonza 뉴클레오펙션, Maxagen 전기천공 등의 하나 이상을 사용할 수 있다. 형질감염, 형질도입 또는 감염을 위한 방법은 당업자에게 잘 알려져 있다.
일 실시형태에서, XDP는 48 내지 96시간 동안 적절한 성장 배지에서 형질감염된 패키징 세포의 인큐베이션에 의해 생성되고 0.45 마이크론 필터를 통한 성장 배지의 여과에 의해 수집된다. 일부 경우에, XDP는 10% 또는 10-30% 밀도 구배 수크로스 완충액에서 원심분리에 의해 추가로 농축될 수 있다. 다른 경우에, XDP는 이온-교환 수지 또는 크기 배제 수지의 사용과 같은 컬럼 크로마토그래피에 의해 농축될 수 있다.
VII. 적용
본 명세서에 제공된 CasX 단백질 및 가이드를 포함하는 XDP 시스템은 세포에서 표적 핵산을 변형시키는 방법에 유용하다. 표적 핵산을 변형하는 XDP 시스템에서, 방법은 본 명세서에 기재된 CasX:gNA 시스템의 임의의 실시형태를 이용하고, 선택적으로 본 명세서에 기재된 공여자 주형 실시형태를 포함한다. 일부 경우에, 방법은 표적 핵산을 포함하는 세포에서 돌연변이체 단백질의 발현을 녹-다운시킨다. 다른 경우에, 방법은 돌연변이체 단백질의 발현을 녹-아웃시킨다. 또 다른 경우에, 방법은 표적 핵산에서 돌연변이를 교정하여 기능성 단백질을 초래한다.
일부 실시형태에서, 방법은 표적 핵산을 포함하는 세포를 표적 핵산에 상보적인 표적화 서열을 포함하는 가이드 핵산(gNA) 및 CasX 단백질의 RNP를 포함하는 XDP의 유효량과 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX 단백질에 의한 표적 핵산의 변형을 초래한다. 또 다른 실시형태에서, XDP는 세포를 XDP와 접촉시키는 것이 표적 핵산 서열 내로 공여자 주형의 삽입을 초래하는 공여자 주형을 추가로 포함한다. 일부 경우에, 공여자 주형은 표적 핵산 유전자에서 돌연변이를 교정하기 위해 RNP와 연계하여 사용되는 반면, 다른 경우에는 공여자 주형을 사용하여 표적 핵산 유전자의 발현 생성물의 녹-다운 또는 녹-아웃 발현에 돌연변이를 삽입한다.
일부 실시형태에서, 세포에서 표적 핵산을 변형시키는 방법은 표적 핵산을 포함하는 세포를 유효한 용량의 XDP와 접촉시키는 것을 포함하며 여기서 세포는 시험관내 또는 생체외에서 변형된다.
세포에서 표적 핵산을 변형시키는 방법의 다른 실시형태에서, 세포는 생체내에서 변형되며, 여기서 치료적으로-유효한 용량의 XDP가 대상체에게 투여된다. 방법은 RNP가 AAV와 같은 바이러스 시스템에서 전달되는 핵산에 비해 상대적으로 수명이 짧다는 점에서 바이러스 전달 시스템에 비해 이점이 있다. XDP 시스템의 추가의 이점은 XDP의 향성을 조작함에 의해 시스템을 특정 세포 유형에 매칭하는 능력이다. 일부 실시형태에서, 전달된 RNP의 반감기는 약 24h, 또는 약 48h, 또는 약 72h, 또는 약 96h, 또는 약 120h, 또는 약 1주이다. 치료 방법에 의해, XDP의 투여는 대상체에서 질환과 연관된 하나, 둘 또는 그 이상의 증상, 임상 매개변수 또는 평가변수의 개선을 초래한다.
일부 실시형태에서, XDP가 투여된 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택된다. 특정 실시형태에서, 대상체는 인간이다. 방법의 일 실시형태에서, XDP는 적어도 약 1 x 105 XDP 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg의 용량으로 대상체에게 투여된다. 다른 실시형태에서, VLP는 적어도 약 1 x 105 입자/kg 내지 적어도 약 1 x 1016 입자/kg의 용량으로 대상체에게 투여된다. 또 다른 실시형태에서, VLP는 적어도 약 1 x 105 입자/kg 내지 약 1 x 1016 입자/kg, 또는 적어도 약 1 x 106 입자/kg 내지 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 107 입자/kg 내지 약 1 x 1014 입자/kg의 용량으로 대상체에게 투여된다. 다른 실시형태에서, VLP는 적어도 약 1 x 105 입자/kg 내지 적어도 약 1 x 1016 입자/kg의 용량으로 대상체에게 투여된다. 일 실시형태에서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 동맥-내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체내, 안내, 유리체내, 림프내, 복강내 경로 및 망막-하 경로로 구성된 군으로부터 선택된 투여 경로에 의해 투여된다.
또 다른 실시형태에서, 개시내용은 본 명세서에 기재된 임의의 실시형태의 XDP의 치료적으로 유효한 용량을 사용하여 1회 이상의 연속적 용량을 포함하는 치료 요법에 따른 질환을 갖는 대상체의 치료 방법을 제공한다. 치료 요법의 일 실시형태에서, 치료적으로 유효한 용량은 단일 용량으로 투여된다. 치료 요법의 또 다른 실시형태에서, 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 한 번, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여된다.
VIII. 키트 및 제조 물품
또 다른 양태에서, 본 명세서에 기재된 실시형태의 조성물을 포함하는 키트가 본 명세서에 제공된다. 일부 실시형태에서, 키트는 본 명세서에 기재된 임의의 실시형태의 치료 페이로드를 포함하는 XDP, 부형제 및 적합한 용기(예를 들어, 튜브, 바이알 또는 플레이트)를 포함한다. 특정 실시형태에서, 치료 페이로드는 CasX 및 gNA의 RNP이다.
일부 실시형태에서, 키트는 완충액, 뉴클레아제 억제제, 프로테아제 억제제, 리포솜, 치료제, 표지, 표지 시각화 시약, 또는 전기한 것의 임의의 조합을 추가로 포함한다. 일부 실시형태에서, 키트는 약학적으로 허용가능한 담체, 희석제 또는 부형제를 추가로 포함한다. 일부 실시형태에서, 키트는 사용 설명서를 추가로 포함한다.
IX. 예시적인 실시형태
다음의 예시적인 실시형태는 단지 예로서 제공된다.
일부 실시형태에서, XDP 시스템은 표 25에서 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 91%, 또는 표 26의 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 적어도 80% 또는 적어도 85%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 24에 기재된 바와 같은 플라스미드 pXDP40(서열번호: 882)에 의해 인코딩된 버젼 44를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 코딩되는 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 25에서 편집 검정 희석액에 따라 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 37%, 또는 표 26의 편집 검정 희석액에 따라 적어도 5%, 적어도 10% 또는 적어도 13%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 24에 기재된 바와 같은 플라스미드 pXDP62(서열번호: 904)에 의해 인코딩된 버전 63을 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 28에서 편집 검정 희석액에 따라 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75% 또는 적어도 77%, 또는 표 29의 편집 검정 희석액에 따라 적어도 20%, 적어도 25%, 적어도 30% 또는 적어도 32%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 27에 기재된 바와 같은 플라스미드 pXDP72(서열번호: 917)에 의해 인코딩된 버전 74a를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 28에서 편집 검정 희석액에 따라 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65% 또는 적어도 67%, 또는 표 29의 편집 검정 희석액에 따라 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 38%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 27에 기재된 바와 같은 플라스미드 pXDP73(서열번호: 918)에 의해 인코딩된 버전 75a를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 31에서 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 91%, 또는 표 32의 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 적어도 80% 또는 적어도 85%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 30에 기재된 바와 같은 플라스미드 pXDP40(서열번호: 949)에 의해 인코딩된 버전 44는 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 31에서 편집 검정 희석액에 따라 적어도 25%, 적어도 30%, 적어도 35% 또는 적어도 37%, 또는 표 32의 편집 검정 희석액에 따라 적어도 5%, 적어도 10% 또는 적어도 13%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 30에 기재된 바와 같은 플라스미드 pXDP62(서열번호: 971)에 의해 인코딩된 버전 63을 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 34에서 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 94%, 또는 표 35의 편집 검정 희석액에 따라 적어도 75%, 적어도 80%, 적어도 85%, 적어도 87%, 적어도 90% 또는 적어도 95%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 표 33에 기재된 바와 같은 플라스미드 pXDP127(서열번호: 976)에 의해 인코딩된 버전 102를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 34에서 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 적어도 80% 또는 적어도 84%, 또는 표 35의 편집 검정 희석액에 따라 적어도 70%, 적어도 75%, 또는 적어도 80%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 플라스미드 pXDP0017에 의해 인코딩된 버전 7을 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 코딩되는 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 37에서 편집 검정 희석액에 따라 적어도 25%, 적어도 25%, 적어도 30% 또는 적어도 33%, 또는 표 38의 편집 검정 희석액에 따라 적어도 1.8%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 플라스미드 pXDP78 + pXDP54에 의해 인코딩된 버전 66B를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 인코딩된 VSV 당단백질 및 sgRNA를 포함한다.
일부 실시형태에서, XDP 시스템은 표 37에서 편집 검정 희석액에 따라 적어도 10%, 적어도 15%, 적어도 20% 또는 적어도 21%, 또는 표 38의 편집 검정 희석액에 따라 적어도 5%, 적어도 7% 또는 적어도 9%의 편집 효율을 포함한다. 일부 실시형태에서, XDP 시스템은 플라스미드 pXDP83 + pXDP59에 의해 인코딩된 버전 87B를 포함한다. 일부 실시형태에서, XDP 시스템은 pGP2에 의해 코딩되는 VSV 당단백질 및 sgRNA를 포함한다.
편집 효율은 당업계에 공지된 임의의 방법 또는 검정에 의해 측정될 수 있다. 당업자는 이러한 검정을 식별하고 사용하는 방법을 알고 있을 것이다. 일부 실시형태에서, 편집 효율은, 예를 들어, 도 69-70에 도시된 바와 같이 %TDT 양성 세포로서 측정될 수 있다.
일부 실시형태에서, XDP 시스템은 배열을 포함하지 않는 XDP 시스템과 비교하여 증가된 편집 효율을 초래하는, 상기 배열에 하나 이상의 플라스미드 또는 요소를 포함한다. 일부 실시형태에서, XDP 시스템은 동일한 요소 및/또는 배열을 포함하지 않는 XDP 시스템에 비하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 가질 수 있다.
일부 실시형태에서, XDP 시스템은 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래될 수 있고, Gag-프로테아제-CasX, 당단백질(VSV-G) 및 가이드 RNA(sgRNA)를 인코딩하는 3개 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열될 수 있다(도 52a). 예시적인 실시형태에서, XDP 시스템 버전 44는 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하고(도 52a), 여기서 버전 44는 동일한 요소 및/또는 배열을 포함하지 않는 XDP 시스템에 비하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70% , 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 53a에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, CA, NC, Pro 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 63은 MA, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 63은 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 감마레트로바이러스(FLV 및 MMLV)로부터 유래될 수 있고, 도 59b에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, pp12, CA 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 74a는 MA, pp12, CA, 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 74a는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래될 수 있고 도 62b에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, P2A, P2B, P10, CA, NC 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 102는 MA, P2A, P2B, P10, CA, NC 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 102는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 39a에 도시된 바와 같이 3개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드의 요소는 MA, CA, NC, p1/p6 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 7은 MA, CA, NC, p1/p6 및 CasX로 배열된 구조적 플라스미드의 요소를 포함하며, 여기서 버전 7은 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 56a에 도시된 바와 같이 4개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드 1의 요소는 MA, P2A, P2B, P10, CA 및 CasX로 배열될 수 있고 구조적 플라스미드 2의 요소는 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 66B는 MA, P2A, P2B, P10, CA, 및 CasX로 배열된 구조적 플라스미드 1의 요소와 MA, P2A, P2B, P10, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드 2의 요소를 포함하며, 여기서 버전 66B는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
일부 실시형태에서, XDP 시스템은 도 57a에 도시된 바와 같이 4개의 플라스미드에 의해 인코딩될 수 있다. 구조적 플라스미드 1의 요소는 MA, pp21/24, P12/P3/P8, CA 및 CasX로 배열될 수 있고 구조적 플라스미드 2의 요소는 MA, pp21/24, P12/P3/P8, CA, NC, Pro 및 CasX로 배열될 수 있다. 예시적인 실시형태에서, XDP 시스템 버전 87B는 MA, pp21/24, P12/P3/P8, CA, 및 CasX로 배열된 구조적 플라스미드 1의 요소와 MA, pp21/24, P12/P3/P8, CA, NC, Pro 및 CasX로 배열된 구조적 플라스미드 2의 요소를 포함하며, 여기서 버전 87B는 동일한 요소 및/또는 배열을 포함하지 않는 XDP와 비교하여 적어도 1%, 3%, 5%, 7%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99% 또는 100%의 증가된 편집 효율을 갖는다.
본 명세서에 개시된 XDP 시스템은 오토레트로바이러스아과(렌티바이러스, 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스), 및 스푸마레트로바이러스아과를 포함하는 레트로바이러스과 바이러스 패밀리로부터 유래될 수 있다. 예시적인 XDP 시스템 버전 및 그의 해당하는 바이러스는 표 25, 26, 28, 29, 31, 32, 34, 35, 37 및 38에 나타나있다.
X. 열거된 실시형태
발명은 다음 세트의 열거된 예시적인 실시형태를 참조하여 정의될 수 있다:
세트 I
실시형태 I-1. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) CasX 단백질; 및
iii) gag 폴리단백질과 CasX 단백질 사이의 프로테아제 절단 부위;
b. 가이드 RNA를 인코딩하는 서열을 포함하는 제2 핵산;
c. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제3 핵산:
i) gag 폴리단백질; 및
ii) CasX 단백질과 gag 폴리단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 적어도 하나의 프로테아제를 포함하는 pol 폴리단백질; 및
d. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제4 핵산.
실시형태 I-2. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) CasX 단백질;
iii) gag 폴리단백질과 CasX 단백질 사이의 프로테아제 절단 부위; 및
iv) CasX 단백질과 gag 폴리단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 프로테아제;
b. 가이드 RNA를 인코딩하는 서열을 포함하는 제2 핵산; 및
c. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제3 핵산.
실시형태 I-3. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 포함하는 융합 폴리펩티드를 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) CasX 단백질; 및
iii) gag 폴리단백질과 CasX 단백질 사이의 프로테아제 절단 부위;
b. 가이드 RNA를 인코딩하는 서열을 포함하는 제2 핵산;
c. CasX 단백질과 gag 폴리단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 프로테아제를 인코딩하는 서열을 포함하는 제3 핵산; 및
d. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제4 핵산.
실시형태 I-4. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 인코딩하는 서열을 포함하는 제1 핵산
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질; 및
ii) 가이드 RNA 및 가이드 RNA 안으로 삽입된 레트로바이러스 Psi 패키징 요소를 포함하는 키메라 RNA;
b. Cas X 단백질을 인코딩하는 서열을 포함하는 제2 핵산; 및
c. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제3 핵산.
실시형태 I-5. 다음을 포함하는 CasX 전달 입자(CasX XDP) 시스템:
a. 다음을 인코딩하는 서열을 포함하는 제1 핵산:
i) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
ii) RNA 결합 도메인 단백질; 및
iii) gag 폴리단백질과 RNA 결합 도메인 단백질 사이의 선택적 프로테아제 절단 부위;
b. 가이드 RNA 및 CasX 단백질을 인코딩하는 서열을 포함하는 제2 핵산;
c. gag 폴리단백질과 RNA 결합 도메인 단백질 사이의 프로테아제 절단 부위를 절단할 수 있는 프로테아제를 인코딩하는 서열을 포함하는 제3 핵산; 및
d. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하는 서열을 포함하는, 제4 핵산.
실시형태 I-6. 실시형태 5에 있어서, RNA 결합 도메인 단백질은 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된, XDP 시스템.
실시형태 I-7. 실시형태 1-3 중 어느 하나에 있어서, 표 8 또는 표 9의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 I-8. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 매트릭스 폴리펩티드(MA)와 캡시드 폴리펩티드(CA) 사이 및/또는 캡시드 폴리펩티드(CA)와 뉴클레오캡시드 폴리펩티드(NC) 사이에 하나 이상의 프로테아제 절단 부위를 포함하고, 여기서 하나 이상의 프로테아제 절단 부위는 프로테아제에 의해 절단되어질 수 있는, XDP 시스템.
실시형태 I-9. 세트 I의 선행하는 실시형태 중 어느 하나에 있에서, 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 MMP-2, -3, -7, -9, -10 및 -11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 I-10. 실시형태 1에 있어서, pol 폴리단백질은 레트로바이러스 폴리단백질인, XDP 시스템.
실시형태 I-11. 실시형태 10에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 또는 렌티바이러스인, XDP 시스템.
실시형태 I-12. 실시형태 11에 있어서, 렌티바이러스는 인간 면역결핍 바이러스(HIV)인, XDP 시스템.
실시형태 I-13. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리단백질은 레트로바이러스 폴리단백질인, XDP 시스템.
실시형태 I-14. 실시형태 13에 있어서, gag 폴리단백질은 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 또는 렌티바이러스로부터 유래되는, XDP 시스템.
실시형태 I-15. 실시형태 14에 있어서, gag 폴리단백질은 렌티바이러스 폴리단백질인, XDP 시스템.
실시형태 I-16. 실시형태 15에 있어서, 렌티바이러스 gag 폴리펩티드는 HIV-1 gag 폴리단백질인, XDP 시스템.
실시형태 I-17. 실시형태 13-16 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 I-18. 실시형태 16 또는 실시형태 17에 있어서, HIV-1 gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, HIV gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
a. MA 폴리펩티드 및 CA 폴리펩티드;
b. CA 폴리펩티드 및 p2 폴리펩티드;
c. p2 폴리펩티드 및 NC 폴리펩티드;
d. NC 폴리펩티드 및 p1 폴리펩티드; 및
e. p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 I-19. 실시형태 18에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 MMP-2, -3, -7, -9, -10 및 -11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 I-20. 실시형태 19에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 I-21. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하고 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 I-22. 실시형태 21에 있어서, 공여자 주형 핵산 서열은 표적 핵산 유전자의 적어도 일부 또는 표적 핵산 유전자의 조절 요소를 포함하는, XDP 시스템.
실시형태 I-23. 실시형태 21 또는 실시형태 22에 있어서, 공여자 주형 핵산 서열은 표적 핵산 유전자 또는 표적 핵산 유전자의 조절 요소에서 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 I-24. 실시형태 21 또는 실시형태 22에 있어서, 공여자 주형 핵산 서열은 표적 핵산 유전자 또는 표적 핵산 유전자의 조절 요소와 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 I-25. 실시형태 24에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 I-26. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 I-27. 실시형태 26에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 597-781로 구성된 서열의 그룹으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 I-28. 실시형태 26 또는 실시형태 27에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-29. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 20개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-30. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 19개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-31. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 18개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-32. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 17개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-33. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 16개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-34. 실시형태 28에 있어서, 가이드 RNA의 표적화 서열은 15개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 I-35. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 I-36. 실시형태 35에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 I-37. 실시형태 35 또는 실시형태 36에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 I-38. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 I-39. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군으로부터 선택된 서열에 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 I-40. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC, 및 CTC로 구성된 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 I-41. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 I-42. 실시형태 41에 있어서, 하나 이상의 NLS는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 I-43. 실시형태 41 또는 실시형태 42에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에서 발현되는, CasX 변이체.
실시형태 I-44. 실시형태 41 또는 실시형태 42에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에서 발현되는, CasX 변이체.
실시형태 I-45. 실시형태 41 또는 실시형태 42에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에서 발현되는, CasX 변이체.
실시형태 I-46. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 I-47. 실시형태 1-45 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 I-48. 실시형태 1-45 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 유지하는, XDP 시스템.
실시형태 I-49. 실시형태 48에 있어서, dCasX는 다음 잔기에서 돌연변이를 포함하는, XDP 시스템:
a. 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
b. 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 I-50. 실시형태 49에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 I-51. 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 외피 당단백질은 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, 로타바이러스, 노워크 바이러스, 장 아데노바이러스, 파보바이러스, 뎅기열 바이러스, 원숭이 수두, 모노네가바이러스, 광견병 바이러스, 라고스 박쥐 바이러스, 모콜라 바이러스, 듀벤하지 바이러스, 유럽 박쥐 바이러스 1, 유럽 박쥐 바이러스 2, 호주 박쥐 바이러스, 에페메로바이러스, 베시큘로바이러스, 수포성 구내염 바이러스(VSV), 단순 포진 바이러스 유형 1, 단순 포진 바이러스 유형 2, 수두 대상포진, 거대세포 바이러스, 엡스타인-바 바이러스(EBV), 인간 헤르페스바이러스(HHV), 인간 헤르페스바이러스 유형 6, 인간 헤르페스바이러스 유형 8, 인간 면역 결핍 바이러스(HIV), 유두종 바이러스, 뮤어라인 감마헤르페스바이러스, 아르헨티나 출혈열 바이러스, 볼리비아 출혈열 바이러스, 사비아-연관된 출혈열 바이러스, 베네수엘라 출혈열 바이러스, 라사 열 바이러스, 마추포 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 크림-콩고 출혈열 바이러스, 한타바이러스, 리프트 밸리 열 바이러스, 에볼라 출혈열 바이러스, 마르부르크 출혈열 바이러스, 카이사누르 숲병 바이러스, 옴스크 출혈열 바이러스, 진드기-매개 뇌염 유발 바이러스, 헨드라 바이러스, 니파 바이러스, 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 서부 말 뇌염 바이러스, 사스-연관된 코로나바이러스(SARS-CoV) 및 웨스트나일 바이러스로 구성된 군으로부터 선택되는 외피 바이러스로부터 유래된, XDP 시스템.
실시형태 I-52. 실시형태 51에 있어서, 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템.
실시형태 I-53. 실시형태 1-50 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 I-54. 실시형태 53에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 I-55. 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 I-56. 실시형태 54에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 I-57. 실시형태 55 또는 실시형태 56에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포, 또는 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 I-58. 실시형태 56 또는 실시형태 57에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 I-59. CasX 단백질을 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
a. 실시형태 1-54 중 어느 하나의 XDP 시스템을 실시형태 56-58 중 어느 하나의 패키징 세포 안으로 도입하는 단계;
b. XDP가 생성되도록 하는 조건 하에서 패키징 세포를 번식시키는 단계; 및
c. 패키징 세포에 의해 생산된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 I-60. 실시형태 59의 방법에 의해 생성된 XDP.
실시형태 I-61. 다음을 포함하는 XDP:
a. 레트로바이러스 캡시드(CA), 매트릭스, (MA) 및 뉴클레오캡시드(NC) 폴리펩티드
b. 표적 세포에 대한 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
c. XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 연관된 CasX 단백질 및 가이드 RNA.
실시형태 I-62. 실시형태 61에 있어서, 실시형태 39-50 중 어느 하나의 CasX 및 실시형태 26-38 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 I-63. 위형화 바이러스 외피 당단백질은 실시형태 57 또는 실시형태 58의 패키징 세포 또는 패키징 세포 내로 도입된 당단백질을 인코딩하는 핵산으로부터 유래되는, XDP.
실시형태 I-64. 실시형태 60-63에 있어서, 실시형태 21-25 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는, XDP.
실시형태 I-65. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 60-64 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX, 가이드 RNA, 및 선택적으로, 공여자 주형 핵산 서열을 세포 안으로 도입하는 것을 포함하여, 표적 핵산 서열의 변형을 초래하는, 방법.
실시형태 I-66. 실시형태 65에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 I-67. 실시형태 65에 있어서, 변형은 표적 핵산 서열에 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 I-68. 실시형태 65-67 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 I-69. 실시형태 65-68 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 I-70. 실시형태 65-68 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 I-71. 실시형태 70에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 I-72. 실시형태 71에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 I-73. 실시형태 71 또는 실시형태 72에 있어서, XDP는 정맥내, 뇌실내, 수조내, 척수강내, 두개내, 요추, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 및 망막-하 경로로 구성된 군으로부터 선택된 투여 경로에 의해 투여되는, 방법.
실시형태 I-74. 실시형태 71-73 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 I-75. 실시형태 74에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 II
실시형태 II-1. 하기로부터 선택된 성분을 인코딩하는 서열을 포함하는 하나 이상의 핵산을 포함하는 CasX 전달 입자(XDP) 시스템:
a. 매트릭스 폴리펩티드(MA);
b. 캡시드 폴리펩티드(CA);
c. 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
d. CasX 단백질;
e. 가이드 핵산(gNA);
f. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편;
g. RNA 결합 도메인;
h. 프로테아제 절단 부위;
i. gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
j. gag-pol 폴리단백질; 및
k. 프로테아제 절단 부위를 절단할 수 있는 프로테아제.
실시형태 II-2. 실시형태 II-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gag-pol 폴리단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편을 포함하며, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-3. 실시형태 II-2에 있어서, 여기서
a. 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하거나;
b. 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하거나; 또는
c. 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제4 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-4. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-5. 실시형태 II-4에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
c. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-6. 실시형태 II-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-7. 실시형태 II-6에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
c. 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-8. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-9. 실시형태 II-8에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
c. 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 II-10. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-11. 실시형태 II-10에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
c. 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 II-12. 실시형태 II-8-11 중 어느 하나에 있어서, RNA 결합 도메인은 gNA 내에 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP 시스템.
실시형태 II-13. 실시형태 II-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-14. 실시형태 II-13에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
c. 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 II-15. 실시형태 II-1에 있어서, 인코딩된 성분은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-16. 실시형태 II-15에 있어서, 여기서
a. 성분은 단일 핵산 상에 인코딩되고;
b. 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
c. 제1 핵산은 MA, CasX 단백질 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하고; 또는
d. 제1 핵산은 MA, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하고; 그리고 제4 핵산은 프로테아제를 인코딩하는, XDP 시스템.
실시형태 II-17. 실시형태 II-15 또는 실시형태 II-16에 있어서, 개재하는 프로테아제 절단 부위와 함께 MA와 CasX 단백질 성분 사이에 연결된 CA 성분을 추가로 포함하는, XDP 시스템.
실시형태 II-18. 실시형태 II-1에 있어서, 인코딩된 성분은 gag 폴리단백질, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gag-pol 폴리단백질로부터 선택되고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 II-19. 실시형태 II-18에 있어서, 여기서
a. 제1 핵산은 gag 폴리단백질, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA를 인코딩하고; 또는
b. 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 gag-pol 폴리단백질을 인코딩하고; 또는
c. 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제4 핵산은 gNA 및 gag-pol 폴리단백질을 인코딩하는, XDP 시스템.
실시형태 II-20. 실시형태 II-2 또는 실시형태 II-3에 있어서, 표 6의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 II-21. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, MA, CA, gag-TFR-PR 폴리단백질, gag 폴리단백질, 및 gag-pol 폴리단백질은 레트로바이러스로부터 유래되는, XDP 시스템.
실시형태 II-22. 실시형태 II-21에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 II-23. 실시형태 II-22에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 II-24. 실시형태 II-23에 있어서, 렌티바이러스는 HIV-1 또는 SIV인, XDP 시스템.
실시형태 II-25. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 II-26. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, 여기서 gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
a. MA 폴리펩티드 및 CA 폴리펩티드;
b. CA 폴리펩티드 및 p2 폴리펩티드;
c. p2 폴리펩티드 및 NC 폴리펩티드;
d. NC 폴리펩티드 및 p1 폴리펩티드; 및
e. p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 II-27. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제-2(MMP-2), MMP-3, MMP-7, MMP-9, MMP-10, MMP-11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 II-28. 실시형태 II-27에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 II-29. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP 시스템.
실시형태 II-30. 실시형태 II-29에 있어서, 위형화 바이러스 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템.
실시형태 II-31. 실시형태 II-1-29 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 II-32. 실시형태 II-1-28 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 II-33. 실시형태 II-32에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 II-34. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 II-35. 실시형태 II-29에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 2101-2241로 구성된 서열의 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 II-36. 실시형태 II-29 또는 실시형태 II-35에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개 연속적인 뉴클레오티드로 이루어진, XDP 시스템.
실시형태 II-37. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 20개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-38. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 19개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-39. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 18개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-40. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 17개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-41. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 16개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-42. 실시형태 II-36에 있어서, 가이드 RNA의 표적화 서열은 15개 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 II-43. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 II-44. 실시형태 II-43에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 II-45. 실시형태 II-43 또는 실시형태 II-44에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 II-46. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형되는, XDP 시스템.
실시형태 II-47. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군에서 선택된 서열에 대해 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 II-48. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC, 및 CTC로 구성된 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 II-49. 실시형태 II-48에 있어서, PAM 서열에 대한 CasX 단백질의 결합 친화성은 PAM 서열에 대한 서열번호: 1-3의 CasX 단백질 중 어느 하나의 결합 친화성과 비교하여 적어도 1.5-배 더 큰, XDP 시스템.
실시형태 II-50. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 II-51. 실시형태 II-50에 있어서, 하나 이상의 NLS는 PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, RKCLQAGMNLEARKTKK, PRPRKIPR, PPRKKRTVV, NLSKKKKRKREK, RRPSRPFRKP, KRPRSPSS, KRGINDRNFWRGENERKTR, PRPPKMARYDN, KRSFSKAF, KLKIKRPVK, PKTRRRPRRSQRKRPPT, RRKKRRPRRKKRR, PKKKSRKPKKKSRK, HKKKHPDASVNFSEFSK, QRPGPYDRPQRPGPYDRP, LSPSLSPLLSPSLSPL, RGKGGKGLGKGGAKRHRK, PKRGRGRPKRGRGR, 및 MSRRRKANPTKLSENAKKLAKEVEN으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 II-52. 실시형태 II-50 또는 실시형태 II-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에 융합되는, CasX 변이체.
실시형태 II-53. 실시형태 II-50 또는 실시형태 II-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에 융합되는, CasX 변이체.
실시형태 II-54. 실시형태 II-50 또는 실시형태 II-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에 융합되는, CasX 변이체.
실시형태 II-55. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 II-56. 실시형태 II-1-54 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 II-57. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하는, XDP 시스템.
실시형태 II-58. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 II-59. 실시형태 II-58에 있어서, 공여자 주형은 표적 핵산에서 절단 부위에 측접하는 서열에 상보적인 2개의 상동성 암을 포함하는, XDP 시스템.
실시형태 II-60. 실시형태 II-58 또는 실시형태 II-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에서의 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 II-61. 실시형태 II-58 또는 실시형태 II-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산과 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 II-62. 실시형태 II-61에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 II-63. 실시형태 II-1-54 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 보유하는, XDP 시스템.
실시형태 II-64. 실시형태 II-63에 있어서, dCasX는 다음의 잔기에서 돌연변이를 포함하는, XDP 시스템:
a. 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
b. 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 II-65. 실시형태 II-64에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 II-66. 세트 II의 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 II-67. 실시형태 II-66에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 II-68. 실시형태 II-66 또는 실시형태 II-67 중 어느 하나에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 II-69. 실시형태 II-67 또는 실시형태 II-68에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 II-70. 실시형태 II-66-69 중 어느 하나에 있어서, 실시형태 II-1-56 중 어느 하나의 XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
실시형태 II-71. CasX 단백질 및 gNA를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
a. XDP가 생성되도록 하는 조건 하에서 실시형태 II-67-70 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
b. 패키징 세포에 의해 생산된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 II-72. 실시형태 II-71의 방법에 의해 생성된 XDP.
실시형태 II-73. 다음 중에서 선택된 하나 이상의 성분을 포함하는 XDP:
a. 매트릭스 폴리펩티드(MA);
b. 캡시드 폴리펩티드(CA);
c. 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
d. CasX 단백질;
e. 가이드 핵산(gNA);
f. 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
g. RNA 결합 도메인;
실시형태 II-74. 실시형태 II-73에 있어서, XDP는
a. 매트릭스 폴리펩티드(MA);
b. 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
c. XDP에 함유된 CasX 및 gNA를 포함하는, XDP.
실시형태 II-75. 실시형태 II-74에 있어서, 캡시드 폴리펩티드(CA)를 추가로 포함하는, XDP.
실시형태 II-76. 실시형태 II-74 또는 실시형태 II-75에 있어서, 뉴클레오캡시드 폴리펩티드(NC)를 추가로 포함하는, XDP.
실시형태 II-77. 실시형태 II-74-76 중 어느 하나에 있어서, RNA 결합 도메인을 추가로 포함하는, XDP.
실시형태 II-78. 실시형태 II-77에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP.
실시형태 II-79. 실시형태 II-74-78 중 어느 하나에 있어서, CasX 및 gNA는 XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 회합되는, XDP.
실시형태 II-80. 실시형태 II-74-79 중 어느 하나에 있어서, 실시형태 II-47-65 중 어느 하나의 CasX 및 실시형태 II-34-46 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 II-81. 실시형태 II-74-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP.
실시형태 II-82. 실시형태 II-73-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, 로타바이러스, 노워크 바이러스, 장 아데노바이러스, 파보바이러스, 뎅기열 바이러스, 원숭이 수두, 모노네가바이러스, 광견병 바이러스, 라고스 박쥐 바이러스, 모콜라 바이러스, 듀벤하지 바이러스, 유럽 박쥐 바이러스 1, 유럽 박쥐 바이러스 2, 호주 박쥐 바이러스, 에페메로바이러스, 베시큘로바이러스, 수포성 구내염 바이러스(VSV), 단순 포진 바이러스 유형 1, 단순 포진 바이러스 유형 2, 수두 대상포진, 거대세포 바이러스, 엡스타인-바 바이러스(EBV), 인간 헤르페스바이러스(HHV), 인간 헤르페스바이러스 유형 6, 인간 헤르페스바이러스 유형 8, 인간 면역 결핍 바이러스(HIV), 유두종 바이러스, 뮤어라인 감마헤르페스바이러스, 아르헨티나 출혈열 바이러스, 볼리비아 출혈열 바이러스, 사비아-연관된 출혈열 바이러스, 베네수엘라 출혈열 바이러스, 라사 열 바이러스, 마추포 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 크림-콩고 출혈열 바이러스, 한타바이러스, 리프트 밸리 열 바이러스, 에볼라 출혈열 바이러스, 마르부르크 출혈열 바이러스, 카이사누르 숲병 바이러스, 옴스크 출혈열 바이러스, 진드기-매개 뇌염 유발 바이러스, 헨드라 바이러스, 니파 바이러스, 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 동부 말 뇌염 바이러스, 서부 말 뇌염 바이러스, 사스-연관된 코로나바이러스(SARS-CoV) 및 웨스트나일 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP.
실시형태 II-83. 실시형태 II-73-82 중 어느 하나에 있어서, 실시형태 II-58-62 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는 XDP.
실시형태 II-84. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 II-73-83 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하고, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA, 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함하는, 방법.
실시형태 II-85. 실시형태 II-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 II-86. 실시형태 II-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 II-87. 실시형태 II-84-86 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 II-88. 실시형태 II-84-87 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 II-89. 실시형태 II-84-87 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 II-90. 실시형태 II-89에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 II-91. 실시형태 II-90에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 II-92. 실시형태 II-90 또는 실시형태 II-91에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법
실시형태 II-93. 실시형태 II-90-92 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 II-94. 실시형태 II-93에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
실시형태 II-95. RNP가 세포에 들어가도록 세포를 실시형태 II-79-83 중 어느 하나의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 II-96. 실시형태 II-95에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 II-97. 실시형태 II-96에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 II-98. 실시형태 II-95-97 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 II-99. 실시형태 II-95-97 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 II-100. 실시형태 II-99에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 II-101. 실시형태 II-100에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 II-102. 실시형태 II-99-101 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 II-103. 실시형태 II-102에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 III
실시형태 III-1. 다음으로부터 선택된 성분을 인코딩하는 서열을 포함하는 하나 이상의 핵산을 포함하는 CasX 전달 입자(XDP) 시스템:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
(d) CasX 단백질;
(e) 가이드 핵산(gNA);
(f) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편;
(g) RNA 결합 도메인;
(h) 프로테아제 절단 부위;
(i) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(j) gag-pol 폴리단백질; 및
(k) 프로테아제 절단 부위를 절단할 수 있는 프로테아제.
실시형태 III-2. 실시형태 III-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gag-pol 폴리단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편을 포함하고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-3. 실시형태 III-2에 있어서, 여기서
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(b) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제4 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-4. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템,
실시형태 III-5. 실시형태 III-4에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-6. 실시형태 III-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-7. 실시형태 III-6에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-8. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-9. 실시형태 III-8에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 III-10. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-11. 실시형태 III-10에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 III-12. 실시형태 III-8-11 중 어느 하나에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP 시스템.
실시형태 III-13. 실시형태 III-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-14. 실시형태 III-13에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 III-15. 실시형태 III-1에 있어서, 인코딩된 성분은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-16. 실시형태 III-15에 있어서, 여기서
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 MA, CasX 단백질 프로테아제, 및 성분들 사이에 개재된 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하고; 또는
(d) 제1 핵산은 MA, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하고; 그리고 제4 핵산은 프로테아제를 인코딩하는, XDP 시스템.
실시형태 III-17. 실시형태 III-15 또는 실시형태 III-16에 있어서, 개재하는 프로테아제 절단 부위와 함께 MA와 CasX 단백질 성분 사이에 연결된 CA 성분을 추가로 포함하는, XDP 시스템.
실시형태 III-18. 실시형태 III-1에 있어서, 인코딩된 성분은 gag 폴리단백질, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gag-pol 폴리단백질로부터 선택되고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 III-19. 실시형태 III-18에 있어서, 여기서
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA를 인코딩하고; 또는
(b) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 gag-pol 폴리단백질을 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제4 핵산은 gNA 및 gag-pol 폴리단백질을 인코딩하는, XDP 시스템.
실시형태 III-20. 실시형태 III-2 또는 실시형태 III-3에 있어서, 표 6의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 III-21. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, MA, CA, gag-TFR-PR 폴리단백질, gag 폴리단백질, 및 gag-pol 폴리단백질은 레트로바이러스로부터 유래되는, XDP 시스템.
실시형태 III-22. 실시형태 III-21에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 III-23. 실시형태 III-22에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 III-24. 실시형태 III-23에 있어서, 렌티바이러스는 HIV-1 또는 SIV인, XDP 시스템.
실시형태 III-25. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 III-26. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, 여기서 gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
(a) MA 폴리펩티드 및 CA 폴리펩티드;
(b) CA 폴리펩티드 및 p2 폴리펩티드;
(c) p2 폴리펩티드 및 NC 폴리펩티드;
(d) NC 폴리펩티드 및 p1 폴리펩티드; 및
(e) p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 III-27. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제-2(MMP-2), MMP-3, MMP-7, MMP-9, MMP-10, MMP-11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는. XDP 시스템.
실시형태 III-28. 실시형태 III-27에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 III-29. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP 시스템.
실시형태 III-30. 실시형태 III-29에 있어서, 위형화 바이러스 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템.
실시형태 III-31. 실시형태 III-1-29 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 포함하는, XDP 시스템.
실시형태 III-32. 실시형태 III-실시형태 III-1-28 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 III-33. 실시형태 III-32에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 III-34. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 III-35. 실시형태 III-29에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 2101-2241로 구성된 서열의 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 III-36. 실시형태 III-29 또는 실시형태 III-35에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-37. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 20개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-38. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 19개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-39. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 18개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-40. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 17개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-41. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 16개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-42. 실시형태 III-36에 있어서, 가이드 RNA의 표적화 서열은 15개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 III-43. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 III-44. 실시형태 III-43에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합된, XDP 시스템.
실시형태 III-45. 실시형태 III-43 또는 실시형태 III-44에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 III-46. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 III-47. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군에서 선택된 서열에 대해 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 III-48. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC, 및 CTC로 구성된 군으로부터 선택되는 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 III-49. 실시형태 III-48에 있어서, PAM 서열에 대한 CasX 단백질의 결합 친화도는 PAM 서열에 대한 서열번호: 1-3의 CasX 단백질 중 어느 하나의 결합 친화도에 비해 적어도 1.5-배 더 큰, XDP 시스템.
실시형태 III-50. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 III-51. 실시형태 III-50에 있어서, 하나 이상의 NLS는 PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, RKCLQAGMNLEARKTKK, PRPRKIPR, PPRKKRTVV, NLSKKKKRKREK, RRPSRPFRKP, KRPRSPSS, KRGINDRNFWRGENERKTR, PRPPKMARYDN, KRSFSKAF, KLKIKRPVK, PKTRRRPRRSQRKRPPT, RRKKRRPRRKKRR, PKKKSRKPKKKSRK, HKKKHPDASVNFSEFSK, QRPGPYDRPQRPGPYDRP, LSPSLSPLLSPSLSPL, RGKGGKGLGKGGAKRHRK, PKRGRGRPKRGRGR, 및 MSRRRKANPTKLSENAKKLAKEVEN으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 III-52. 실시형태 III-50 또는 실시형태 III-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에 융합된, CasX 변이체.
실시형태 III-53. 실시형태 III-50 또는 실시형태 III-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에 융합된, CasX 변이체.
실시형태 III-54. 실시형태 III-50 또는 실시형태 III-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에 융합된, CasX 변이체.
실시형태 III-55. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 III-56. 실시형태 III-실시형태 III-1-54 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 III-57. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하는, XDP 시스템.
실시형태 III-58. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 III-59. 실시형태 III-58에 있어서, 공여자 주형은 표적 핵산에서의 절단 부위에 측접하는 서열에 상보적인 2개의 상동성 암을 포함하는, XDP 시스템.
실시형태 III-60. 실시형태 III-58 또는 실시형태 III-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에서의 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 III-61. 실시형태 III-58 또는 실시형태 III-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산과 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 III-62. 실시형태 III-61에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 III-63. 실시형태 III-실시형태 III-1-54 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, 여기서 dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 보유하는, XDP 시스템.
실시형태 III-64. 실시형태 III-63에 있어서, dCasX는 다음 잔기에서 돌연변이를 포함하는, XDP 시스템:
(a) 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
(b) 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 III-65. 실시형태 III-64에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 III-66. 세트 III의 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 III-67. 실시형태 III-66에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 III-68. 실시형태 III-실시형태 III-66 또는 실시형태 III-67 중 어느 하나에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 III-69. 실시형태 III-67 또는 실시형태 III-68에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 III-70. 실시형태 III-실시형태 III-66-69 중 어느 하나에 있어서, 실시형태 III-1-56 중 어느 하나의 XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 통합되는, 진핵 세포.
실시형태 III-71. CasX 단백질 및 gNA를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 실시형태 III-67-70 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 III-72. 실시형태 III-71의 방법에 의해 생성된 XDP.
실시형태 III-73. 다음으로부터 선택된 하나 이상의 성분을 포함하는 XDP:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
(d) CasX 단백질;
(e) 가이드 핵산(gNA);
(f) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(g) RNA 결합 도메인;
실시형태 III-74. 실시형태 III-73에 있어서, XDP는
(a) 매트릭스 폴리펩티드(MA);
(b) 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(c) XDP 내에 함유된 CasX 및 gNA를 포함하는, XDP.
실시형태 III-75. 실시형태 III-74에 있어서, 캡시드 폴리펩티드(CA)를 추가로 포함하는, XDP.
실시형태 III-76. 실시형태 III-74 또는 실시형태 III-75에 있어서, 뉴클레오캡시드 폴리펩티드(NC)를 추가로 포함하는, XDP.
실시형태 III-77. 실시형태 III-74-76 중 어느 하나에 있어서, RNA 결합 도메인을 추가로 포함하는, XDP.
실시형태 III-78. 실시형태 III-77에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP.
실시형태 III-79. 실시형태 III-74-78 중 어느 하나에 있어서, CasX 및 gNA가 XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 회합되는, XDP.
실시형태 III-80. 실시형태 III-74-79 중 어느 하나에 있어서, 실시형태 III-47-65 중 어느 하나의 CasX 및 실시형태 III-34-46 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 III-81. 실시형태 III-74-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP.
실시형태 III-82. 실시형태 III-73-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP.
실시형태 III-83. 실시형태 III-73-82 중 어느 하나에 있어서, 실시형태 III-58-62 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는, XDP.
실시형태 III-84. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 III-73-83 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함하는, 방법.
실시형태 III-85. 실시형태 III-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 III-86. 실시형태 III-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 III-87. 실시형태 III-84-86 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 III-88. 실시형태 III-84-87 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 III-89. 실시형태 III-84-87 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 III-90. 실시형태 III-89에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 III-91. 실시형태 III-90에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 III-92. 실시형태 III-90 또는 실시형태 III-91에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
실시형태 III-93. 실시형태 III-90-92 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 III-94. 실시형태 III-93에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
실시형태 III-95. RNP가 세포에 들어가도록 세포를 실시형태 III-79-83 중 어느 하나의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 III-96. 실시형태 III-95에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 III-97. 실시형태 III-96에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 III-98. 실시형태 III-95-97 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 III-99. 실시형태 III-95-97 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 III-100. 실시형태 III-99에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 III-101. 실시형태 III-100에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 III-102. 실시형태 III-99-101 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 III-103. 실시형태 III-102에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 IV
실시형태 IV-1. (a) 내지 (o)로부터 선택된 하나 이상의 성분을 인코딩하거나 (a) 내지 (o)로부터 선택된 성분의 하나 이상의 부분을 인코딩하는 서열을 포함하는 하나 이상의 핵산 및 CasX를 위한 전달 입자(XDP) 시스템:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 뉴셀로캡시드 폴리펩티드(NC);
(d) p1 스페이서 펩티드;
(e) p2 스페이서 펩티드;
(f) p6 스페이서 펩티드;
(g) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 뉴클레오캡시드 폴리펩티드(NC), p1 스페이서, 및 p6 스페이서를 포함하는 gag 폴리단백질;
(h) CasX 단백질;
(i) 가이드 핵산(gNA);
(j) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편;
(k) RNA 결합 도메인;
(l) 프로테아제 절단 부위;
(m) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(n) gag-pol 폴리단백질; 및
(o) 프로테아제 절단 부위를 절단할 수 있는 프로테아제.
실시형태 IV-2. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gag-pol 폴리단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편을 포함하며, 여기서 성분들은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-3. 실시형태 IV-2에 있어서,
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이에 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(b) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gag-pol 폴리단백질을 인코딩하고; 그리고 제4 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-4. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, 프로테아제 절단 부위, CasX 단백질, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-5. 실시형태 IV-4에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-6. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag 폴리단백질, 프로테아제 절단 부위, 프로테아제, CasX 단백질, gNA 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-7. 실시형태 IV-6에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 gag 폴리단백질, 프로테아제, CasX 단백질 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-8. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-9. 실시형태 IV-8에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 IV-10. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-TFR-PR 폴리단백질, CasX 단백질, 프로테아제 절단 부위, gNA, RNA 결합 도메인, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-11. 실시형태 IV-10에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 RNA 결합 도메인을 인코딩하고; 또는
(c) 제1 핵산은 gag-TFR-PR 폴리단백질, CasX 단백질, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA 및 RNA 결합 도메인을 인코딩하는, XDP 시스템.
실시형태 IV-12. 실시형태 IV-8-11 중 어느 하나에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP 시스템.
실시형태 IV-13. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag-pol 폴리단백질, CasX 단백질, 프로테아제 절단 부위, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA로부터 선택되고, 여기서 성분은 1개, 2개 또는 3개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-14. 실시형태 IV-13에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고; 또는
(c) 제1 핵산은 gag-pol 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하는, XDP 시스템.
실시형태 IV-15. 실시형태 IV-1에 있어서, 인코딩된 성분은 MA, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 및 위형화 바이러스 외피 당단백질 또는 항체 단편으로부터 선택되고, 여기서 성분은 1개, 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-16. 실시형태 IV-15에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되고;
(b) 제1 핵산은 MA, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편 및 gNA를 인코딩하고;
(c) 제1 핵산은 MA, CasX 단백질 프로테아제, 및 성분들 사이에 개재된 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제3 핵산은 gNA를 인코딩하고; 또는
(d) 제1 핵산은 MA, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 제3 핵산은 gNA를 인코딩하고; 그리고 제4 핵산은 프로테아제를 인코딩하는, XDP 시스템.
실시형태 IV-17. 실시형태 IV-15 또는 실시형태 IV-16에 있어서, 개재하는 프로테아제 절단 부위를 갖는 CasX 단백질 성분과 MA 사이에 연결된 CA 성분을 추가로 포함하는, XDP 시스템.
실시형태 IV-18. 실시형태 IV-1에 있어서, 인코딩된 성분은 gag 폴리단백질, CasX 단백질, 프로테아제, 프로테아제 절단 부위, gNA, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gag-pol 폴리단백질로부터 선택되고, 여기서 성분은 2개, 3개 또는 4개의 개별 핵산 상에 인코딩되는, XDP 시스템.
실시형태 IV-19. 실시형태 IV-18에 있어서,
(a) 제1 핵산은 gag 폴리단백질, CasX 단백질, 프로테아제, 및 성분들 사이의 개재하는 프로테아제 절단 부위를 인코딩하고; 제2 핵산은 gag-pol 폴리단백질, 위형화 바이러스 외피 당단백질 또는 항체 단편, 및 gNA를 인코딩하고; 또는
(b) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 그리고 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편, gNA 및 gag-pol 폴리단백질을 인코딩하고; 또는
(c) 제1 핵산은 gag 폴리단백질, 개재하는 프로테아제 절단 부위, 및 CasX 단백질을 인코딩하고; 제2 핵산은 프로테아제를 인코딩하고; 제3 핵산은 위형화 바이러스 외피 당단백질 또는 항체 단편을 인코딩하고; 그리고 제4 핵산은 gNA 및 gag-pol 폴리단백질을 인코딩하는, XDP 시스템.
실시형태 IV-20. 실시형태 IV-2 또는 실시형태 IV-3에 있어서, 표 6-8의 핵산 서열 중 어느 하나의 전부 또는 일부를 포함하는, XDP 시스템.
실시형태 IV-21. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, MA, CA, gag-TFR-PR 폴리단백질, gag 폴리단백질, 및 gag-pol 폴리단백질은 레트로바이러스로부터 유래되는, XDP 시스템.
실시형태 IV-22. 실시형태 IV-21에 있어서, 레트로바이러스는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 IV-23. 실시형태 IV-22에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스( FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 IV-24. 실시형태 IV-23에 있어서, 렌티바이러스는 HIV-1 또는 SIV인, XDP 시스템.
실시형태 IV-25. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리펩티드는 p6 폴리펩티드를 추가로 포함하는, XDP 시스템.
실시형태 IV-26. 실시형태 IV-1 내지 25 중 어느 하나에 있어서, gag 폴리펩티드는 MA 폴리펩티드, CA 폴리펩티드, p2 폴리펩티드, NC 폴리펩티드, p1 폴리펩티드, 및 p6 폴리펩티드를 포함하고, 여기서 gag 폴리단백질은 다음 중 하나 이상 사이에 위치한 하나 이상의 프로테아제 절단 부위를 포함하는, XDP 시스템:
(a) MA 폴리펩티드 및 CA 폴리펩티드;
(b) CA 폴리펩티드 및 p2 폴리펩티드;
(c) p2 폴리펩티드 및 NC 폴리펩티드;
(d) NC 폴리펩티드 및 p1 폴리펩티드; 및
(e) p1 폴리펩티드 및 p6 폴리펩티드.
실시형태 IV-27. 실시형태 IV-1 내지 26 중 어느 하나에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제, 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission, b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, PYVF(파스닙 황색 반점 바이러스) 3C-유사 프로테아제, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제-2(MMP-2), MMP-3, MMP-7, MMP-9, MMP-10, MMP-11 및 엔테로키나제로 구성된 프로테아제의 군으로부터 선택되는, XDP 시스템.
실시형태 IV-28. 실시형태 IV-27에 있어서, 프로테아제 절단 부위를 절단할 수 있는 프로테아제는 HIV-1 프로테아제인, XDP 시스템.
실시형태 IV-29. 실시형태 IV-1 내지 28 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP 시스템.
실시형태 IV-30. 실시형태 IV-29에 있어서, 위형화 바이러스 외피 당단백질은 수포성 구내염 바이러스(VSV)로부터 유래되는, XDP 시스템
실시형태 IV-31. 실시형태 IV-1-29 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 IV-32. 실시형태 IV-1-28 중 어느 하나에 있어서, 항체 단편은 표적 세포의 세포 표면 마커 또는 수용체에 대해 결합 친화성을 갖는, XDP 시스템.
실시형태 IV-33. 실시형태 IV-32에 있어서, 항체 단편은 scFv인, XDP 시스템.
실시형태 IV-34. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, gNA는 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 IV-35. 실시형태 IV-29에 있어서, 가이드 RNA 스캐폴드 서열은 서열번호: 4, 5, 및 2101-2241로 구성된 서열의 군으로부터 선택된 서열에 대해 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 또는 100% 서열 동일성을 갖는, XDP 시스템.
실시형태 IV-36. 실시형태 IV-29 또는 실시형태 IV-35에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-37. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 20개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-38. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 19개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-39. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 18개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-40. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 17개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-41. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 16개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-42. 실시형태 IV-36에 있어서, 가이드 RNA의 표적화 서열은 15개의 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 IV-43. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 IV-44. 실시형태 IV-43에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 IV-45. 실시형태 IV-43 또는 실시형태 IV-44에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 IV-46. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 IV-47. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 표 1에 제시된 서열로 구성된 군에서 선택된 서열에 대해 적어도 약 90%, 또는 적어도 약 91%, 또는 적어도 약 92%, 또는 적어도 약 93%, 또는 적어도 약 94%, 또는 적어도 약 95%, 또는 적어도 약 96%, 또는 적어도 약 97%, 또는 적어도 약 98%, 또는 적어도 약 99%, 또는 적어도 100% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 IV-48. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 TTC, ATC, GTC 및 CTC로 구성된 군으로부터 선택된 프로토스페이서 인접 모티프(PAM) 서열에 대한 결합 친화성을 갖는, XDP 시스템.
실시형태 IV-49. 실시형태 IV-48에 있어서, PAM 서열에 대한 CasX 단백질의 결합 친화성은 PAM 서열에 대한 서열번호: 1-3의 CasX 단백질 중 어느 하나의 결합 친화성과 비교하여 적어도 1.5-배 더 큰, XDP 시스템.
실시형태 IV-50. 실시형태 IV-1 내지 49 중 어느 하나에 있어서, CasX 단백질은 하나 이상의 핵 국소화 신호(NLS)를 추가로 포함하는, XDP 시스템.
실시형태 IV-51. 실시형태 IV-50에 있어서, 하나 이상의 NLS는 PKKKRKV, KRPAATKKAGQAKKKK, PAAKRVKLD, RQRRNELKRSP, NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY, RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV, VSRKRPRP, PPKKARED, PQPKKKPL, SALIKKKKKMAP, DRLRR, PKQKKRK, RKLKKKIKKL, REKKKFLKRR, KRKGDEVDGVDEVAKKKSKK, RKCLQAGMNLEARKTKK, PRPRKIPR, PPRKKRTVV, NLSKKKKRKREK, RRPSRPFRKP, KRPRSPSS, KRGINDRNFWRGENERKTR, PRPPKMARYDN, KRSFSKAF, KLKIKRPVK, PKTRRRPRRSQRKRPPT, RRKKRRPRRKKRR, PKKKSRKPKKKSRK, HKKKHPDASVNFSEFSK, QRPGPYDRPQRPGPYDRP, LSPSLSPLLSPSLSPL, RGKGGKGLGKGGAKRHRK, PKRGRGRPKRGRGR, 및 MSRRRKANPTKLSENAKKLAKEVEN으로 구성된 서열의 군으로부터 선택되는, XDP 시스템.
실시형태 IV-52. 실시형태 IV-50 또는 실시형태 IV-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 C-말단에 융합되는, CasX 변이체.
실시형태 IV-53. 실시형태 IV-50 또는 실시형태 IV-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단에 융합되는, CasX 변이체.
실시형태 IV-54. 실시형태 IV-50 또는 실시형태 IV-51에 있어서, 하나 이상의 NLS는 CasX 단백질의 N-말단 및 C-말단에 융합되는, CasX 변이체.
실시형태 IV-55. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, CasX 단백질은 닉카제 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 IV-56. 실시형태 IV-1-54 중 어느 하나에 있어서, CasX 단백질은 이중-가닥 절단 활성을 갖는 뉴클레아제 도메인을 포함하는, XDP 시스템.
실시형태 IV-57. 실시형태 IV-1 내지 56 중 어느 하나에 있어서, 레트로바이러스 패키징 신호를 인코딩하는 핵산을 추가로 포함하는, XDP 시스템.
실시형태 IV-58. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나에 있어서, 표적 핵산에 상보적인 공여자 주형 핵산을 추가로 포함하는, XDP 시스템.
실시형태 IV-59. 실시형태 IV-58에 있어서, 공여자 주형은 표적 핵산에서 절단 부위에 측접하는 서열에 상보적인 2개의 상동성 암을 포함하는, XDP 시스템.
실시형태 IV-60. 실시형태 IV-58 또는 실시형태 IV-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에서의 돌연변이에 대한 교정 서열을 포함하는, XDP 시스템.
실시형태 IV-61. 실시형태 IV-58 또는 실시형태 IV-59에 있어서, 공여자 주형 핵산 서열은 표적 핵산에 비교하여 돌연변이를 포함하는, XDP 시스템.
실시형태 IV-62. 실시형태 IV-61에 있어서, 돌연변이는 공여자 주형 핵산 서열에서 하나 이상의 뉴클레오티드의 삽입, 결실 또는 치환인, XDP 시스템.
실시형태 IV-63. 실시형태 IV-1-54 중 어느 하나에 있어서, CasX 단백질은 촉매적으로 불활성인 CasX(dCasX) 단백질이고, 여기서 dCasX 및 가이드 RNA는 표적 핵산에 결합하는 능력을 보유하는, XDP 시스템.
실시형태 IV-64. 실시형태 IV-63에 있어서, dCasX는 다음 잔기에서 돌연변이를 포함하는, XDP 시스템:
(a) 서열번호: 1의 CasX 단백질에 상응하는 D672, E769, 및/또는 D935; 또는
(b) 서열번호: 2의 CasX 단백질에 상응하는 D659, E756 및/또는 D922.
실시형태 IV-65. 실시형태 IV-64에 있어서, 돌연변이는 잔기에 대한 알라닌의 치환인, XDP 시스템.
실시형태 IV-66. 세트 IV의 세트 I의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 IV-67. 실시형태 IV-66에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 IV-68. 실시형태 IV-66 또는 실시형태 IV-67 중 어느 하나에 있어서, 진핵 세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 IV-69. 실시형태 IV-67 또는 실시형태 IV-68에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 IV-70. 실시형태 IV-66-69 중 어느 하나에 있어서, 실시형태 IV-1-56 중 어느 하나의 XDP 시스템을 인코딩하는 핵산의 전부 또는 일부가 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
실시형태 IV-71. CasX 단백질 및 gNA를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 실시형태 IV-67-70 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 IV-72. 실시형태 IV-71의 방법에 의해 생성된 XDP.
실시형태 IV-73. 다음 중에서 선택된 하나 이상의 성분을 포함하는 XDP:
(a) 매트릭스 폴리펩티드(MA);
(b) 캡시드 폴리펩티드(CA);
(c) 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는 gag 폴리단백질;
(d) CasX 단백질;
(e) 가이드 핵산(gNA);
(f) 표적 세포에 대한 XDP의 결합 및 융합을 제공하는 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(g) RNA 결합 도메인;
실시형태 IV-74. 실시형태 IV-73에 있어서, XDP는
(a) 매트릭스 폴리펩티드(MA);
(b) 위형화 바이러스 외피 당단백질 또는 항체 단편; 및
(c) XDP 내에 함유된 CasX 및 gNA를 포함하는, XDP.
실시형태 IV-75. 실시형태 IV-74에 있어서, 캡시드 폴리펩티드(CA)를 추가로 포함하는, XDP.
실시형태 IV-76. 실시형태 IV-74 또는 실시형태 IV-75에 있어서, 뉴클레오캡시드 폴리펩티드(NC)를 추가로 포함하는, XDP.
실시형태 IV-77. 실시형태 IV-74-76 중 어느 하나에 있어서, RNA 결합 도메인을 추가로 포함하는, XDP.
실시형태 IV-78. 실시형태 IV-77에 있어서, RNA 결합 도메인은 gNA 내로 삽입된 레트로바이러스 Psi 패키징 요소이거나 MS2, PP7 또는 Q베타, U1A, 파지 복제 고리, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 및 가매듭으로 구성된 군으로부터 선택된 단백질인, XDP.
실시형태 IV-79. 실시형태 IV-74-78 중 어느 하나에 있어서, CasX 및 gNA는 XDP 내의 리보핵 단백질 복합체(RNP)에서 함께 회합되는, XDP.
실시형태 IV-80. 실시형태 IV-74-79 중 어느 하나에 있어서, 실시형태 IV-47-65 중 어느 하나의 CasX 및 실시형태 IV-34-46 중 어느 하나의 가이드 RNA를 포함하는, XDP.
실시형태 IV-81. 실시형태 IV-74-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 표 4에 제시된 서열로 구성된 군으로부터 선택된 서열에 대해 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 서열 동일성을 갖는 서열을 포함하는, XDP.
실시형태 IV-82. 실시형태 IV-73-80 중 어느 하나에 있어서, 위형화 바이러스 외피 당단백질은 아르헨티나 출혈열 바이러스, 호주 박쥐 바이러스, 오토그라파 캘리포니아 다발성 핵다면체바이러스, 조류 백혈병 바이러스, 개코원숭이 내인성 바이러스, 볼리비아 출혈열 바이러스, 보르나병 바이러스, 브레다 바이러스, 부니암웨라 바이러스, 칸디푸라 바이러스, 치쿤군야 바이러스, 크리민-콩고 출혈열 바이러스, 뎅기열 바이러스, 듀벤헤지 바이러스, 동부 말 뇌염 바이러스, 에볼라 출혈열 바이러스, 에볼라 자이르 바이러스, 장 아데노 바이러스, 에페메로바이러스, 엡스타인-바 바이러스(EBV), 유럽 박쥐 바이러스1, 유럽 박쥐 바이러스2, 긴팔원숭이 백혈병 바이러스, 한타바이러스, 헨드라 바이러스, A형 간염 바이러스, B형 간염 바이러스, C형 간염 바이러스, D형 간염 바이러스, E형 간염 바이러스, G형 간염 바이러스(GB 바이러스 C), 단순 헤르페스 바이러스 유형 1, 단순 헤르페스 바이러스 유형 2, 인간 거대세포 바이러스(HHV5), 인간 거품 바이러스, 인간 헤르페스 바이러스(HHV), 인간 헤르페스 바이러스 7, 인간 헤르페스 바이러스 유형 6, 인간 헤르페스 바이러스 유형 8, 인간 면역 결핍 바이러스 1(HIV-1), 인간 메타뉴모바이러스, 인간 T-림프구 픽 바이러스 1, 인플루엔자 A, 인플루엔자 B, 인플루엔자 C 바이러스, 일본 뇌염 바이러스, 카포시 육종-연관된 헤르페스바이러스(HHV8), 카이사누르 숲병 바이러스, 라크로스 바이러스, 라고스 박쥐 바이러스, 라사열 바이러스, 림프구성 맥락수막염 바이러스(LCMV), 마추포 바이러스, 마르부르크 출혈열 바이러스, 홍역 바이러스, 중동 호흡기증후군-관련된 코로나바이러스, 모콜라 바이러스, 몰로니 뮤어라인 백혈병 바이러스, 원숭이 수두, 마우스 유선 종양 바이러스, 볼거리 바이러스, 뮤어라인 감마헤르페스 바이러스, 뉴캐슬병 바이러스, 니파 바이러스, 니파 바이러스, 노르워크 바이러스, 옴스크 출혈열 바이러스, 유두종 바이러스, 파보바이러스, 가성광견병 바이러스, 쿠아란필 바이러스, 광견병 바이러스, RD114 내인성 고양이 레트로바이러스, 호흡기 세포융합 바이러스(RSV), 리프트 밸리 발열 바이러스, 로스 리버 바이러스, 로타바이러스, 라우스 육종 바이러스, 풍진 바이러스, 사비아-연관된 출혈열 바이러스, 사스-연관된 코로나바이러스(SARS-CoV), 센다이 바이러스, 타카리베 바이러스, 토고토바이러스, 진드기-매개 뇌염 유발 바이러스, 수두 대상포진 바이러스(HHV3), 수두 대상포진 바이러스(HHV3), 바리올라 메이저 바이러스, 바리올라 마이너 바이러스, 베네수엘라 말 뇌염 바이러스, 베네수엘라 출혈열 바이러스, 수포성 구내염 바이러스(VSV), 베시큘로바이러스, 웨스트 나일 바이러스, 서부 말 뇌염 바이러스 및 지카 바이러스로 구성된 군으로부터 선택된 외피 바이러스로부터 유래되는, XDP.
실시형태 IV-83. 실시형태 IV-73-82 중 어느 하나에 있어서, 실시형태 IV-58-62 중 어느 하나의 공여자 주형 핵산 서열을 추가로 포함하는, XDP.
실시형태 IV-84. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 실시형태 IV-73-83 중 어느 하나의 XDP와 세포를 접촉시키는 것을 포함하며, 여기서 상기 접촉은 CasX 단백질, 가이드 RNA 및, 선택적으로, 공여자 주형 핵산 서열을 세포 내로 도입하여, 표적 핵산 서열의 변형을 초래하는 것을 포함하는, 방법.
실시형태 IV-85. 실시형태 IV-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 IV-86. 실시형태 IV-84에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 IV-87. 실시형태 IV-84-86 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 IV-88. 실시형태 IV-84-87 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 IV-89. 실시형태 IV-84-87 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 IV-90. 실시형태 IV-89에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 IV-91. 실시형태 IV-90에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 IV-92. 실시형태 IV-90 또는 실시형태 IV-91에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
실시형태 IV-93. 실시형태 IV-90-92 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 IV-94. 실시형태 IV-93에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
실시형태 IV-95. RNP가 세포에 들어가도록 세포를 실시형태 IV-79-83 중 어느 하나의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 IV-96. 실시형태 IV-95에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 IV-97. 실시형태 IV-96에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 IV-98. 실시형태 IV-95-97 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 IV-99. 실시형태 IV-95-97 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 IV-100. 실시형태 IV-99에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 IV-101. 실시형태 IV-100에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 IV-102. 실시형태 IV-99-101 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 IV-103. 실시형태 IV-102에 있어서, XDP는 적어도 약 1 x 105 입자, 또는 적어도 약 1 x 106 입자, 또는 적어도 약 1 x 107 입자, 또는 적어도 약 1 x 108 입자, 또는 적어도 약 1 x 109 입자, 또는 적어도 약 1 x 1010 입자, 또는 적어도 약 1 x 1011 입자, 또는 적어도 약 1 x 1012 입자, 또는 적어도 약 1 x 1013 입자, 또는 적어도 약 1 x 1014 입자, 또는 적어도 약 1 x 1015 입자, 또는 적어도 약 1 x 1016 입자의 용량으로 투여되는, 방법.
세트 V
실시형태 V-1. 다음을 인코딩하는 하나 이상의 핵산을 포함하는 전달 입자(XDP) 시스템:
(a) 하나 이상의 레트로바이러스 성분;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-2. 실시형태 V-1에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-3. 실시형태 V-2에 있어서, 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-4. 실시형태 V-2에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-5. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질과 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-6. 실시형태 V-5에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, 리보뉴클레아제(RNAse), 데옥시리보뉴클레아제(DNAse), 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해성 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-7. 실시형태 V-6에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-8. 실시형태 V-7에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-9. 실시형태 V-8에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-10. 실시형태 V-9에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-11. 실시형태 V-5에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 시스템.
실시형태 V-12. 실시형태 V-11에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-13. 실시형태 V-12에 있어서, 스캐폴드 서열은 표 3에 제시된 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-14. 실시형태 V-13에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-15. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 핵산은:
(a) 레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 하나 이상의 프로테아제 절단 부위;
(c) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(d) 레트로바이러스 gag-pol 폴리단백질; 및
(e) 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스 프로테아제로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템.
실시형태 V-16. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 하나 이상의 레트로바이러스 성분은 오르토레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 시스템.
실시형태 V-17. 실시형태 V-16에 있어서, 오르소레트로바이러스아과 바이러스가 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-18. 실시형태 V-16에 있어서, 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-19. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-20. 실시형태 V-19에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-21. 실시형태 V-19 또는 실시형태 V-20에 있어서, 하나 이상의 레트로바이러스 성분은 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782 및 234-339로 구성된 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-22. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-23. 실시형태 V-22에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-24. 실시형태 V-23에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및 선택적으로 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-25. 실시형태 V-22에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-26. 실시형태 V-25에 있어서, 향성 인자는 XDP와 표적 세포의 세포 표면과의 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-27. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 알파레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-28. 실시형태 V-27에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-29. 실시형태 V-28에 있어서, gag 폴리단백질은 N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-30. 실시형태 V-27-29 중 어느 하나에 있어서, 하나 이상의 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-31. 실시형태 V-27-30 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-32. 실시형태 V-31에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-33. 실시형태 V-31에 있어서, 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 서열의 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-34. 실시형태 V-33에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G이고, 선택적으로 VSV-G 당단백질은 서열번호: 438의 서열을 포함하는, XDP 시스템.
실시형태 V-35. 실시형태 V-27-34 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-36. 실시형태 V-35에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-37. 실시형태 V-36에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-38. 실시형태 V-37에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-39. 실시형태 V-38에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-40. 실시형태 V-39에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-41. 실시형태 V-39에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-42. 실시형태 V-39-41 중 어느 하나에 있어서, CasX는 PKKKRKV(서열번호: 130), KRPAATKKAGQAKKKK(서열번호: 131), PAAKRVKLD(서열번호: 132), RQRRNELKRSP(서열번호: 133), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 134), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호: 135), VSRKRPRP(서열번호: 136), PPKKARED(서열번호: 137), PQPKKKPL(서열번호: 138), SALIKKKKKMAP(서열번호: 139), DRLRR(서열번호: 140), PKQKKRK(서열번호: 141), RKLKKKIKKL(서열번호: 142), REKKKFLKRR(서열번호: 143), KRKGDEVDGVDEVAKKKSKK(서열번호: 144), RKCLQAGMNLEARKTKK(서열번호: 145), PRPRKIPR(서열번호: 146), PPRKKRTVV(서열번호: 147), NLSKKKKRKREK(서열번호: 148), RRPSRPFRKP(서열번호: 149), KRPRSPSS(서열번호: 150), KRGINDRNFWRGENERKTR(서열번호: 151), PRPPKMARYDN(서열번호: 152), KRSFSKAF(서열번호: 153), KLKIKRPVK(서열번호: 154), PKTRRRPRRSQRKRPPT(서열번호: 156), RRKKRRPRRKKRR(서열번호: 159), PKKKSRKPKKKSRK(서열번호: 160), HKKKHPDASVNFSEFSK(서열번호: 161), QRPGPYDRPQRPGPYDRP(서열번호: 162), LSPSLSPLLSPSLSPL(서열번호: 163), RGKGGKGLGKGGAKRHRK(서열번호: 164), PKRGRGRPKRGRGR(서열번호: 165), MSRRRKANPTKLSENAKKLAKEVEN(서열번호: 157), PKKKRKVPPPPAAKRVKLD(서열번호: 155), 및 PKKKRKVPPPPKKKRKV(서열번호: 166)로 구성된 서열의 군으로부터 선택되는 하나 이상의 NLS를 추가로 포함하며, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-43. 실시형태 V-35에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-44. 실시형태 V-43에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-45. 실시형태 V-44에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-46. 실시형태 V-45에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-47. 실시형태 V-44-46 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-48. 실시형태 V-27-47 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-49. 실시형태 V-48에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성된, XDP 시스템.
실시형태 V-50. 실시형태 V-48 또는 실시형태 V-49에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-51. 실시형태 V-27-50 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-52. 실시형태 V-51에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-53. 실시형태 V-52에 있어서, 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-54. 실시형태 V-51에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-55. 실시형태 V-54에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-56. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 베타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-57. 실시형태 V-56에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-58. 실시형태 V-56에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-59. 실시형태 V-56-58 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템.
실시형태 V-60. 실시형태 V-56-59 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-61. 실시형태 V-60에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-62. 실시형태 V-61에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-63. 실시형태 V-62에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-64. 실시형태 V-56-63 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-65. 실시형태 V-64에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-66. 실시형태 V-65에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-67. 실시형태 V-66에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-68. 실시형태 V-67에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-69. 실시형태 V-68에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397, 또는 11의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-70. 실시형태 V-68에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-71. 실시형태 V-68-70 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-72. 실시형태 V-64에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성되는 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-73. 실시형태 V-72에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-74. 실시형태 V-73에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-75. 실시형태 V-73에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-76. 실시형태 V-73-75 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-77. 실시형태 V-56-76 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-78. 실시형태 V-77에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-79. 실시형태 V-77 또는 실시형태 V-78에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-80. 실시형태 V-56-79 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-81. 실시형태 V-80에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-82. 실시형태 V-81에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-83. 실시형태 V-80에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-84. 실시형태 V-83에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-85. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 델타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-86. 실시형태 V-85에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-87. 실시형태 V-86에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-88. 실시형태 V-85-87 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-89. 실시형태 V-85-88 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-90. 실시형태 V-89에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-91. 실시형태 V-89에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-92. 실시형태 V-91에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-93. 실시형태 V-85-92 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-94. 실시형태 V-93에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-95. 실시형태 V-94에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-96. 실시형태 V-95에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-97. 실시형태 V-96에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-98. 실시형태 V-97에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-99. 실시형태 V-97에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-100. 실시형태 V-97-99 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-101. 실시형태 V-93에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-102. 실시형태 V-101에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 V-103. 실시형태 V-102에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-104. 실시형태 V-102에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-105. 실시형태 V-102-104 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-106. 실시형태 V-85-105 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-107. 실시형태 V-106에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-108. 실시형태 V-106 또는 실시형태 V-107에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-109. 실시형태 V-85-108 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-110. 실시형태 V-109에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-111. 실시형태 V-110에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-112. 실시형태 V-109에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-113. 실시형태 V-112에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-114. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 엡실론레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-115. 실시형태 V-114에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-116. 실시형태 V-114에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-117. 실시형태 V-114-116 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-118. 실시형태 V-114-117 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-119. 실시형태 V-118에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-120. 실시형태 V-118에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-121. 실시형태 V-120에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-122. 실시형태 V-114-121 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-123. 실시형태 V-122에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-124. 실시형태 V-123에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-125. 실시형태 V-124에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-126. 실시형태 V-125에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-127. 실시형태 V-126에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-128. 실시형태 V-126에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-129. 실시형태 V-126-128 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-130. 실시형태 V-122에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-131. 실시형태 V-130에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 V-132. 실시형태 V-131에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-133. 실시형태 V-131에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-134. 실시형태 V-131-133 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-135. 실시형태 V-114-134 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-136. 실시형태 V-135에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-137. 실시형태 V-135 또는 실시형태 V-136에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-138. 실시형태 V-114-137 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-139. 실시형태 V-138에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-140. 실시형태 V-139에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-141. 실시형태 V-139에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-142. 실시형태 V-141에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-143. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 감마레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-144. 실시형태 V-143에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-145. 실시형태 V-144에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
실시형태 V-146. 실시형태 V-143-145 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-147. 실시형태 V-143-146 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-148. 실시형태 V-147에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-149. 실시형태 V-147에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-150. 실시형태 V-149에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-151. 실시형태 V-143-150 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-152. 실시형태 V-151에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-153. 실시형태 V-152에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-154. 실시형태 V-153에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-155. 실시형태 V-154에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-156. 실시형태 V-155에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-157. 실시형태 V-155에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-158. 실시형태 V-155-157 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-159. 실시형태 V-151에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-160. 실시형태 V-159에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-161. 실시형태 V-160에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-162. 실시형태 V-160에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-163. 실시형태 V-160-162 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-164. 실시형태 V-143-163 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-165. 실시형태 V-164에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-166. 실시형태 V-164 또는 실시형태 V-165에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-167. 실시형태 V-164-166 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-168. 실시형태 V-167에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-169. 실시형태 V-168에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-170. 실시형태 V-167에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-171. 실시형태 V-170에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-172. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 렌티바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-173. 실시형태 V-172에 있어서, gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-174. 실시형태 V-173에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드를 포함하는, XDP 시스템.
실시형태 V-175. 실시형태 V-172-173 중 어느 하나에 있어서, 핵산은
(a) Gag-Pol 폴리단백질;
(b) 하나 이상의 프로테아제 절단 부위;
(c) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(d) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-176. 실시형태 V-172-175 중 어느 하나에 있어서, 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-177. 실시형태 V-176에 있어서, 렌티바이러스는 HIV-1인, XDP 시스템
실시형태 V-178. 실시형태 V-172-177 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-179. 실시형태 V-178에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-180. 실시형태 V-178에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-181. 실시형태 V-180에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-182. 실시형태 V-172-181 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-183. 실시형태 V-182에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-184. 실시형태 V-183에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-185. 실시형태 V-184에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-186. 실시형태 V-185에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-187. 실시형태 V-186에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-188. 실시형태 V-186에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-189. 실시형태 V-186-188 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-190. 실시형태 V-182에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-191. 실시형태 V-190에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
실시형태 V-192. 실시형태 V-191에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-193. 실시형태 V-191에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-194. 실시형태 V-191-193 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-195. 실시형태 V-172-194 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-196. 실시형태 V-195에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-197. 실시형태 V-195 또는 실시형태 V-196에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-198. 실시형태 V-195-197 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-199. 실시형태 V-198에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-200. 실시형태 V-198에 있어서, 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-201. 실시형태 V-198에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-202. 실시형태 V-201에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-203. 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 스푸마레트로바이러스아과 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자.
실시형태 V-204. 실시형태 V-203에 있어서, gag 폴리단백질은 p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
실시형태 V-205. 실시형태 V-204에 있어서, gag 폴리단백질은, N-말단으로부터 C-말단으로, p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드를 포함하는, XDP 시스템.
실시형태 V-206. 실시형태 V-203-205 중 어느 하나에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템.
실시형태 V-207. 실시형태 V-203-206 중 어느 하나에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-208. 실시형태 V-207에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-209. 실시형태 V-207에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
실시형태 V-210. 실시형태 V-209에 있어서, 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
실시형태 V-211. 실시형태 V-203-210 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
실시형태 V-212. 실시형태 V-211에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-213. 실시형태 V-212에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-214. 실시형태 V-213에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
실시형태 V-215. 실시형태 V-214에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
실시형태 V-216. 실시형태 V-215에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-217. 실시형태 V-216에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
실시형태 V-218. 실시형태 V-203-217 중 어느 하나에 있어서, CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
실시형태 V-219. 실시형태 V-211에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
실시형태 V-220. 실시형태 V-219에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
실시형태 V-221. 실시형태 V-220에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
실시형태 V-222. 실시형태 V-221에 있어서, 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
실시형태 V-223. 실시형태 V-220-222 중 어느 하나에 있어서, 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
실시형태 V-224. 실시형태 V-203-223 중 어느 하나에 있어서,
(a) 성분은 단일 핵산 상에 인코딩되거나;
(b) 성분은 2개의 핵산 상에 인코딩되거나;
(c) 성분은 3개의 핵산 상에 인코딩되거나;
(d) 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템.
실시형태 V-225. 실시형태 V-224에 있어서, 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
실시형태 V-226. 실시형태 V-224 또는 실시형태 V-225에 있어서, 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
실시형태 V-227. 실시형태 V-224-226 중 어느 하나에 있어서, 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
실시형태 V-228. 실시형태 V-227에 있어서, 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
실시형태 V-229. 실시형태 V-228에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
실시형태 V-230. 실시형태 V-227에 있어서, 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
실시형태 V-231. 실시형태 V-230에 있어서, 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
실시형태 V-232. 세트 V의 선행하는 실시형태 중 어느 하나에 있어서, gag 폴리단백질 및 치료 페이로드는 융합 단백질로서 발현되는, XDP 시스템.
실시형태 V-233. 실시형태 V-232에 있어서, 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하지 않는, XDP 시스템.
실시형태 V-234. 실시형태 V-232에 있어서, 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
실시형태 V-235. 실시형태 V-232-234 중 어느 하나에 있어서, 융합 단백질은 gag 폴리단백질의 성분 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
실시형태 V-236. 실시형태 V-234 및/또는 실시형태 V-235에 있어서, 절단 부위는 Gag-Pol 폴리단백질의 프로테아제, gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제, 또는 비-레트로바이러스 이종성 프로테아제에 의해 절단될 수 있는, XDP 시스템.
실시형태 V-237. 실시형태 V-236에 있어서, 절단 부위는 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
실시형태 V-238. 실시형태 V-236에 있어서, 절단 부위는 Gag-Pol 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
실시형태 V-239. 실시형태 V-236에 있어서, 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, 파스닙 황색 반점 바이러스 프로테아제, 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 및 엔테로키나제로 구성된 군으로부터 선택되는, XDP 시스템.
실시형태 V-240. 실시형태 V-239에 있어서, 비-레트로바이러스 이종성 프로테아제는 PreScission(HRV3C 프로테아제)인, XDP 시스템.
실시형태 V-241. 실시형태 V-239에 있어서, 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV)인, XDP 시스템.
실시형태 V-242. 실시형태 V-12-13, 44-47, 73-76, 96-99, 103-106, 132-135, 161-164, 192-195 또는 221-224 중 어느 하나에 있어서, 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
실시형태 V-243. 실시형태 V-242에 있어서, 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
실시형태 V-244. 실시형태 V-242 또는 실시형태 V-243에 있어서, 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
실시형태 V-245. 실시형태 V-12-13, 44-47, 73-76, 96-99, 103-106, 132-135, 161-164, 192-195 또는 221-224 중 어느 하나에 있어서, 가이드 RNA는 화학적으로 변형된, XDP 시스템.
실시형태 V-246. 실시형태 V-12-13, 44-47, 73-76, 96-99, 103-106, 132-135, 161-164, 192-195 또는 221-224 중 어느 하나에 있어서, 가이드 RNA는 Psi 패키징 요소, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 또는 가매듭으로 구성된 군으로부터 선택된 요소를 포함하고, 여기서 요소는 MS2, PP7, Q베타, U1A 및 파지 R-고리로 구성된 군에서 선택된 CasX 내로 합체된 단백질에 대해 친화성을 갖는, XDP 시스템.
실시형태 V-247. 세트 V의 선행하는 실시형태 중 어느 하나의 XDP 시스템을 포함하는 진핵 세포.
실시형태 V-248. 실시형태 V-247에 있어서, 세포는 패키징 세포인, 진핵 세포.
실시형태 V-249. 실시형태 V-247 또는 실시형태 V-248에 있어서, 진핵세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
실시형태 V-250. 실시형태 V-248 또는 실시형태 V-249에 있어서, 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
실시형태 V-251. 실시형태 V-247-250 중 어느 하나에 있어서, XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
실시형태 V-252. 치료 페이로드를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 실시형태 V-248-251 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법.
실시형태 V-253. 실시형태 V-252의 방법에 의해 생성된 XDP.
실시형태 V-254. 실시형태 V-253에 있어서, CasX 및 가이드 RNA의 RNP의 치료 페이로드 및, 선택적으로, 공여자 주형을 포함하는, XDP.
실시형태 V-255. 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 세포를 실시형태 V-254의 XDP와 접촉시키는 것을 포함하며, 여기서 상기 접촉은 RNP 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하는 것을 포함하고, 여기서 가이드 RNA에 의해 표적화된 표적 핵산은 CasX에 의해 변형되는, 방법.
실시형태 V-256. 실시형태 V-255에 있어서, 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 V-257. 실시형태 V-255에 있어서, 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
실시형태 V-258. 실시형태 V-255-257 중 어느 하나에 있어서, 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
실시형태 V-259. 실시형태 V-255-258 중 어느 하나에 있어서, 세포는 시험관내 또는 생체외에서 변형되는, 방법.
실시형태 V-260. 실시형태 V-255-258 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 V-261. 실시형태 V-260에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 V-262. 실시형태 V-261에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 V-263. 실시형태 V-261 또는 실시형태 V-262에 있어서, XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
실시형태 V-264. 실시형태 V-261-263 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 V-265. 실시형태 V-264에 있어서, XDP는 적어도 약 1 x 10^5 입자/kg, 또는 적어도 약 1 x 10^6 입자/kg, 또는 적어도 약 1 x 10^7 입자/kg, 또는 적어도 약 1 x 10^8 입자/kg, 또는 적어도 약 1 x 10^9 입자/kg, 또는 적어도 약 1 x 10^10 입자/kg, 또는 적어도 약 1 x 10^11 입자/kg, 또는 적어도 약 1 x 10^12 입자/kg, 또는 적어도 약 1 x 10^13 입자/kg, 또는 적어도 약 1 x 10^14 입자/kg, 또는 적어도 약 1 x 10^15 입자/kg, 또는 적어도 약 1 x 10^16 입자/kg의 용량으로 투여되는, 방법.
실시형태 V-266. 실시형태 V-261-265 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량의 XDP를 사용하여 1회 이상의 연속적 용량을 포함하는 치료 요법에 따라 대상체에게 투여되는, 방법.
실시형태 V-267. 실시형태 V-266에 있어서, 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 1회, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여되는, 방법.
실시형태 V-268. RNP가 세포에 들어가도록 세포를 실시형태 V-253 또는 실시형태 V-254의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
실시형태 V-269. 실시형태 V-268에 있어서, RNP는 표적 핵산에 결합하는, 방법.
실시형태 V-270. 실시형태 V-269에 있어서, 표적 핵산은 CasX에 의해 절단되는, 방법.
실시형태 V-271. 실시형태 V-268-270 중 어느 하나에 있어서, 세포는 시험관내에서 변형되는, 방법.
실시형태 V-272. 실시형태 V-268-270 중 어느 하나에 있어서, 세포는 생체내에서 변형되는, 방법.
실시형태 V-273. 실시형태 V-272에 있어서, XDP는 대상체에게 투여되는, 방법.
실시형태 V-274. 실시형태 V-273에 있어서, 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
실시형태 V-275. 실시형태 V-272-274 중 어느 하나에 있어서, XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
실시형태 V-276. 실시형태 V-275에 있어서, XDP는 적어도 약 1 x 10^5 입자/kg, 또는 적어도 약 1 x 10^6 입자/kg, 또는 적어도 약 1 x 10^7 입자/kg, 또는 적어도 약 1 x 10^8 입자/kg, 또는 적어도 약 1 x 10^9 입자/kg, 또는 적어도 약 1 x 10^10 입자/kg, 또는 적어도 약 1 x 10^11 입자/kg, 또는 적어도 약 1 x 10^12 입자/kg, 또는 적어도 약 1 x 10^13 입자/kg, 또는 적어도 약 1 x 10^14 입자/kg, 또는 적어도 약 1 x 10^15 입자/kg, 또는 적어도 약 1 x 10^16 입자/kg의 용량으로 투여되는, 방법.
실시형태 V-277. 다음을 포함하는 XDP 입자:
(a) 레트로바이러스 기질(MA) 폴리펩티드;
(b) XDP 내에 캡슐화된 치료 페이로드; 및
(c) XDP 표면 상에 합체된 향성 인자.
실시형태 V-278. 실시형태 V-277에 있어서,
(a) 캡시드 폴리펩티드(CA);
(b) 뉴클레오캡시드 폴리펩티드(NC);
(c) P2A 펩티드, P2B 펩티드;
(d) P10 펩티드;
(e) p12 펩티드
(f) PP21/24 펩티드;
(g) P12/P3/P8 펩티드;
(h) P20 펩티드;
(i) p1 펩티드; 및
(j) p6 펩티드로부터 선택된 하나 이상의 레트로바이러스 성분을 추가로 포함하는, XDP 입자.
실시형태 V-279. 실시형태 V-277 또는 실시형태 V-278에 있어서, 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-280. 실시형태 V-279에 있어서, 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 입자.
실시형태 V-281. 실시형태 V-279에 있어서, 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 입자.
실시형태 V-282. 실시형태 V-277-281 중 어느 하나에 있어서, 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 입자.
실시형태 V-283. 실시형태 V-282에 있어서, 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-284. 실시형태 V-283에 있어서, CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 입자.
실시형태 V-285. 실시형태 V-284에 있어서, CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 입자.
실시형태 V-286. 실시형태 V-285에 있어서, CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 입자.
실시형태 V-287. 실시형태 V-286에 있어서, CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 입자.
실시형태 V-288. 실시형태 V-282에 있어서, 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 입자.
실시형태 V-289. 실시형태 V-288에 있어서, CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 입자.
실시형태 V-290. 실시형태 V-289에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 입자.
실시형태 V-291. 실시형태 V-290에 있어서, 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 입자.
실시형태 V-292. 실시형태 V-286-291 중 어느 하나에 있어서, 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 입자.
실시형태 V-293. 실시형태 V-277-292 중 어느 하나에 있어서, 레트로바이러스 성분은 오르소레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 입자.
실시형태 V-294. 실시형태 V-293에 있어서, 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-295. 실시형태 V-293에 있어서, 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 입자.
실시형태 V-296. 질환을 갖는 대상체의 치료를 위한 약제로서 사용하기 위한, 선행하는 실시형태 중 어느 하나의 XDP 입자, 또는 XDP 시스템.
본 상세한 설명은 다수의 예시적인 구성, 방법, 매개변수 등을 제시한다. 그러나, 그러한 상세한 설명은 본 개시내용의 범주를 제한하기 위한 것이 아니라 예시적인 실시형태의 상세한 설명으로서 제공된다는 것을 인식해야 한다. 상기에서 기술된 본 주제의 실시형태는 단독으로 또는 하나 이상의 다른 양태 또는 실시형태와 조합하여 유익할 수 있다. 전술한 상세한 설명을 제한하지 않고, 개시내용의 특정한 비-제한적 실시형태가 하기에 제공된다. 본 개시내용을 읽을 때 당업자에게 명백한 바와 같이, 개별적으로 번호가 매겨진 실시형태 각각은 개별적으로 번호가 매겨진 이전 또는 다음의 실시형태 중 임의의 것과 함께 사용되거나 조합될 수 있다. 이는 이러한 모든 실시형태의 조합에 대한 지원을 제공하기 위한 것이고 하기에 명시적으로 제공된 실시형태의 조합으로 제한되지 않는다.
실시예
실시예 1: CasX 작제물의 생성, 발현 및 정제
1. 성장과 발현
플랑크토마이세테스(서열번호: 2의 아미노산 서열을 갖고 하기 표 6의 서열에 의해 인코딩됨)로부터 유래된 CasX Stx2(본 명세서에서 CasX2로도 지칭됨)에 대한 발현 작제물은 대장균에 최적화된 코돈인 유전자 단편(Twist Biosciences)으로부터 구축되었다. 어셈블리된 작제물은 TEV-절단가능한 C-말단의, TwinStrep 태그를 함유하고 암피실린 내성 유전자를 함유하는 pBR322-유도체 플라스미드 백본 내로 클로닝되었다. 발현 작제물을 화학적으로 유능한 BL21*(DE3) 대장균 내로 형질전환시키고, 출발 배양물을 UltraYield Flasks(Thomson Instrument Company)에서 37℃, 200RPM에서 카르베니실린이 보충된 LB 브로쓰에서 밤새 성장시켰다. 다음 날, 이 배양물을 사용하여 발현 배양물을 1:100 비율(출발 배양물:발현 배양물)로 접종했다. 발현 배양물은 카르베니실린이 보충된 Terrific 브로쓰(Novagen)였고 37℃, 200RPM에서 UltraYield 플라스크에서 성장했다. 배양물이 2의 OD에 도달하면 16℃로 냉각하고 1M 스톡으로부터, IPTG(이소프로필 β-D-1-티오갈락토피라노사이드)를 1mM의 최종 농도로 첨가했다. 배양물을 16℃, 200RPM에서 20시간 동안 유도한 후 4℃, 4000xg에서 15분 동안 원심분리에 의해 수확했다. 세포 페이스트의 무게를 측정하고 용리 완충액(50mM HEPES-NaOH, 250mM NaCl, 5mM MgCl2, 1mM TCEP, 1mM 벤자미딘-HCL, 1mM PMSF, 0.5% CHAPS, 10% 글리세롤, pH 8)에서 세포 페이스트의 그램당 용리 완충액 5mL의 비율로 재현탁했다. 재현탁되면 샘플을 정제할 때까지 -80℃에서 동결했다.
[표 6]: CasX Stx2 작제물의 DNA 서열
2. 정제
동결된 샘플을 자기 교반과 함께 4℃에서 밤새 해동하였다. 생성된 용리액의 점도는 초음파처리에 의해 감소되었고 용리는 Emulsiflex C3(Avestin)을 사용하여 17k PSI에서 3회 통과의 균질화에 의해 완료되었다. 용리액을 50,000x g, 4℃에서 30분 동안 원심분리에 의해 정화하고 상등액을 수집했다. 정화된 상등액을 중력 흐름에 의해 Heparin 6 Fast Flow 컬럼(GE Life Sciences)에 적용했다. 컬럼을 5 CV의 헤파린 완충액 A(50mM HEPES-NaOH, 250mM NaCl, 5mM MgCl2, 1mM TCEP, 10% 글리세롤, pH 8)로 세정한 다음 5 CV의 헤파린 완충액 B(500mM로 조정된 NaCl 농도를 갖는 완충액 A)로 세정하였다. 단백질을 5 CV의 헤파린 완충액 C(1M로 조정된 NaCl 농도를 갖는 완충액 A)로 용출하고, 분획으로 수집하였다. 분획을 브래드포드 검정에 의해 단백질에 대해 검정하고 단백질-함유 분획을 풀링했다. 풀링된 헤파린 용출액을 중력 흐름에 의해 Strep-Tactin XT Superflow 컬럼(IBA Life Sciences)에 적용했다. 컬럼을 5 CV의 Strep 완충액(50mM HEPES-NaOH, 500mM NaCl, 5mM MgCl2, 1mM TCEP, 10% 글리세롤, pH 8)으로 세정했다. 단백질을 50mM D-비오틴이 첨가된 5 CV의 Strep 완충액을 사용하여 컬럼으로부터 용출하고 분획으로 수집했다. CasX-함유 분획을 풀링하고 30kDa 컷-오프 스핀 농축기를 사용하여 4℃에서 농축하고 슈퍼덱스 200pg 컬럼(GE Life Sciences) 상에서 크기 배제 크로마토그래피로 정제했다. 컬럼은 AKTA Pure FPLC 시스템(GE Life Sciences)에 의해 작동되는 SEC 완충액(25mM 인산나트륨, 300mM NaCl, 1mM TCEP, 10% 글리세롤, pH 7.25)으로 평형화되었다. 적절한 분자량에서 용출된 CasX-함유 분획을 풀링하고, 30kDa 컷-오프 스핀 농축기를 사용하여 4℃에서 농축하고, 분취하고 액체 질소에서 급속-동결한 후 -80℃에 보관했다.
3. 결과
정제 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분해하고 도 1 및 도 3에 도시된 바와 같이 콜로이드성 쿠마시 염색에 의해 가시화하였다. 도 1에서, 왼쪽에서 오른쪽으로 레인은 분자량 표준, 펠렛: 세포 용리에 이어서 불용성 부분, 용리액: 세포 용리에 이어서 가용성 부분, 관류: 헤파린 컬럼에 결합하지 않은 단백질, 세정: 세정 완충액에서 컬럼으로부터 용출된 단백질, 용출: 용출 완충액으로 헤파린 컬럼에서 용출된 단백질, 관류: StrepTactinXT 컬럼에 결합하지 않은 단백질, 용출: 용출 완충액으로 StrepTactin XT 컬럼에서 용출된 단백질, 주입: s200 겔 여과 컬럼 상으로 주입된 농축된 단백질, 동결: 농축 및 동결된 s200 용리액으로부터 풀링된 분획. 도 3에서, 오른쪽에서 왼쪽으로 레인은 주입(겔 여과 컬럼 상에 주입된 단백질의 샘플) 분자량 마커이고, 레인 3-9는 표시된 용출 부피로부터의 샘플이다. 겔 여과로부터의 결과를 도 2에 도시되어 있다. 68.36mL 피크는 CasX의 겉보기 분자량에 해당하고 대부분의 CasX 단백질을 함유한다. 평균 수율은 콜로이드성 쿠마시 염색에 의해 평가된 바와 같이 75% 순도를 갖는 배양물의 리터당 정제된 CasX 단백질 0.75mg이었다.
실시예 2: CasX 작제물 CasX 119, 438 및 457
CasX 119, 438 및 457 작제물(표 7의 서열)을 생성하기 위해, 코돈-최적화된 CasX 37 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 1의 CasX Stx2 작제물에 기반됨)을 표준 클로닝 방법을 사용하여 포유동물 발현 플라스미드(pStX; 도 4 참조) 안으로 클로닝하였다. CasX 119를 구축하기 위해, CasX 37 작제물 DNA를 각각 프라이머 oIC539 및 oIC88 뿐만 아니라 oIC87 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 사용한 2가지 반응에서 PCR 증폭시켰다(도 5 참조). CasX 457을 구축하기 위해, CasX 365 작제물 DNA를 각각 프라이머 oIC539 및 oIC212, oIC211 및 oIC376, oIC375 및 oIC551, 및 oIC550 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제(New England BioLabs Cat# M0491L)를 사용하여 4가지 반응에서 PCR 증폭시켰다. CasX 438을 구축하기 위해, CasX 119 작제물 DNA를 각각 프라이머 oIC539 및 oIC689, oIC688 및 oIC376, oIC375 및 oIC551, 및 oIC550 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 4가지 반응에서 PCR 증폭시켰다. 그런 다음 생성된 PCR 증폭 생성물을 제조업체의 프로토콜에 따라 Zymoclean DNA 클린 및 농축기(Zymo Research Cat# 4014)를 사용하여 정제했다. pStX 백본을 플라스미드 pStx34 내 두 부위 사이에 있는 DNA의 2931 염기쌍 단편을 제거하기 위해 XbaI 및 SpeI를 사용하여 단리했다. 단리된 백본 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit(Zymo Research Cat#D4002)를 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제되었다. 그런 다음 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 3개의 단편을 함께 이어맞추었다. pStx34에서 어셈블리된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격이거나 또는 전기-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트(Qiagen Cat# 27104)를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. pStX34는 단백질에 대한 EF-1α 프로모터뿐만 아니라 퓨로마이신 및 카르베니실린 둘 모두에 대한 선택 마커를 포함한다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된 NEB Turbo Competent 대장균(NEB Cat #C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. SaCas9 및 SpyCas9 대조군 플라스미드는 각각의 단백질 및 가이드에 대해 교환된 pStX의 단백질 및 가이드 영역을 사용하여 상기에서 기술된 pStX 플라스미드와 유사하게 제조되었다. SaCas9 및 SpyCas9에 대한 표적화 서열은 문헌에서 얻거나 확립된 방법에 따라 합리적으로 설계되었다. CasX 119, 438 및 457 단백질의 발현 및 회수는 실시예 1의 일반적인 방법론을 사용하여 수행되었다(그러나 DNA 서열은 대장균에서 발현을 위해 최적화된 코돈이었다).
CasX 변이체 119: WT CasX에 대한 동일한 발현 및 정제 계획에 따라, CasX 변이체 119에 대해 다음 결과가 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 도 6 및 도 8에 도시된 바와 같이 콜로이드성 쿠마시 염색에 의해 가시화했다. 겔 여과로부터의 결과를 도 7에 나타내었다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 95% 순도에서 배양 리터당 정제된 CasX 단백질 11.7mg이었다.
CasX 변이체 438: WT CasX에 대한 동일한 발현 및 정제 계획에 따라, CasX 변이체 438에 대해 다음 결과가 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 도 9 및 도 11에 도시된 바와 같이 콜로이드성 쿠마시 염색에 의해 가시화했다. 겔 여과로부터의 결과를 도 10에 나타내었다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 97.5% 순도에서 배양 리터당 정제된 CasX 단백질 13.1mg이었다.
CasX 변이체 457: WT CasX에 대한 동일한 발현 및 정제 계획에 따라, CasX 변이체 457에 대해 다음 결과가 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 도 12 및 도 14에 도시된 바와 같이 콜로이드성 쿠마시 염색 및 도 13에 도시된 바와 같이 겔 여과에 의해 가시화했다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 91.6% 순도에서 배양 리터당 정제된 CasX 단백질 9.76mg이었다.
전반적으로, 결과는 CasX 변이체가 실험적 검정 및 평가에 충분한 높은 수준의 순도로 생산 및 회수될 수 있음을 뒷받침한다.
[표 7]: CasX 119, 438 및 457의 서열
실시예 3: CasX 작제물 488, 491, 515 및 527
CasX 488 작제물(표 8에서의 서열)을 생성하기 위해, 코돈-최적화된 CasX 119 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환, L379R 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 1의 CasX Stx2 작제물에 기반됨)을 표준 클로닝 방법을 사용하여 대상 플라스미드(pStX; 도 4 참조) 안으로 클로닝하였다. CasX 491 작제물(표 8에서의 서열)을 생성하기 위해, 코돈-최적화된 CasX 484 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환, L379R 치환, [P793] 결실, I658V 치환 및 F399L 치환과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 1의 CasX Stx2 작제물에 기반됨)을 표준 클로닝 방법을 사용하여 대상 플라스미드(pStX; 도 4 참조) 안으로 클로닝하였다. 작제물 CasX 1(CasX 서열번호: 1)은 표준 클로닝 방법을 사용하여 대상 벡터 안으로 클로닝되었다. CasX 488을 구축하기 위해, CasX 119 작제물 DNA는 프라이머 oIC765 및 oIC762를 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 PCR 증폭되었다(도 5 참조). CasX 491을 구축하기 위해, 코돈 최적화된 CasX 484 작제물 DNA는 프라이머 oIC765 및 oIC762를 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 PCR 증폭되었다(도 5 참조). CasX 1 작제물은 프라이머 oIC766 및 oIC784를 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 PCR 증폭되었다. 각 PCR 생성물은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출하여 정제되었다. 상응하는 단편은 그런 다음 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트 상에 도말된 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 내로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론을 제한 효소 클로닝을 사용하여 포유동물 발현 벡터 pStx34 안으로 서브클로닝했다. pStx34 백본과 pStx1에서의 CasX 488 및 491 클론은 각각 XbaI 및 BamHI로 단리되었다. 단리된 백본 및 각 삽입 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔(Gold Bio Cat# A-201-500)로부터 겔 추출에 의해 정제되었다. 그런 다음 깨끗한 백본과 삽입물은 제조업체의 프로토콜에 따라 T4 리가제(New England Biolabs Cat# M0202L)를 사용하여 함께 결찰되었다. 결찰된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
CasX 515(표 8에서의 서열)를 구축하기 위해, CasX 491 작제물 DNA를 각각 프라이머 oIC539 및 oSH556 뿐만 아니라 oSH555 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 2가지 반응에서 PCR 증폭시켰다(도 5 참조). CasX 527(표 8에서의 서열)을 구축하기 위해, CasX 491 작제물 DNA를 각각 프라이머 oIC539 및 oSH584 뿐만 아니라 oSH583 및 oIC540을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하는 2가지 반응에서 PCR 증폭시켰다. PCR 생성물은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의해 정제되었다. pStX 백본은 플라스미드 pStx56에서의 두 부위 사이에 있는 DNA의 2931 염기쌍 단편을 제거하기 위해 XbaI 및 SpeI를 사용하여 단리되었다. 단리된 백본 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의해 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx56에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트 상에 도말된 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. pStX34는 단백질에 대한 EF-1α 프로모터뿐만 아니라 퓨로마이신 및 카르베니실린 둘 모두에 대한 선택 마커를 포함한다. pStX56은 단백질에 대한 EF-1α 프로모터뿐만 아니라 퓨로마이신 및 카르베니실린 둘 모두에 대한 선택 마커를 포함한다 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가아제와 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 적절한 항생제를 함유하는 LB-아가 플레이트 상에 도말된 NEB Turbo Competent 대장균(NEB Cat #C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. SaCas9 및 SpyCas9 대조군 플라스미드는 각각의 단백질 및 가이드에 대해 교환된 pStX의 단백질 및 가이드 영역을 사용하여 상기에서 기술된 pStX 플라스미드와 유사하게 제조되었다. SaCas9 및 SpyCas9에 대한 표적화 서열은 문헌에서 얻거나 확립된 방법에 따라 합리적으로 설계되었다. CasX 작제물의 발현 및 회수는 실시예 1의 일반적인 방법론을 사용하여 수행되었고 다음과 같이 요약된다:
CasX 변이체 488: WT CasX 서열번호: 2에 대한 동일한 발현 및 정제 계획에 따라, 다음 결과가 CasX 변이체 488에 대해 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 콜로이드성 쿠마시 염색에 의해 가시화뿐만 아니라 겔 여과에 의해 분석하였다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 98.8% 순도에서 배양 리터당 정제된 CasX 단백질 2.7mg이었다.
CasX 변이체 491: WT CasX 서열번호: 2에 대한 동일한 발현 및 정제 계획에 따라, 다음 결과가 CasX 변이체 488에 대해 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 콜로이드성 쿠마시 염색에 의해 가시화뿐만 아니라 겔 여과에 의해 분석하였다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 99.4% 순도에서 배양 리터당 정제된 CasX 단백질 12.4mg이었다.
CasX 변이체 515: WT CasX 서열번호: 2에 대한 동일한 발현 및 정제 계획에 따라, 다음 결과가 CasX 변이체 488에 대해 얻어졌다. 정제 절차 전반에 걸쳐 샘플을 SDS-PAGE에 의해 분석하고 콜로이드성 쿠마시 염색에 의해 가시화뿐만 아니라 겔 여과에 의해 분석하였다. 평균 수율은, 콜로이드성 쿠마시 염색에 의해 평가될 때, 87.2% 순도에서 배양 리터당 정제된 CasX 단백질 7.8mg이었다.
[표 8]: CasX 488, 491, 515 및 527의 서열
실시예 4: CasX 작제물 278-280, 285-288, 290, 291, 293, 300, 492 및 493의 설계 및 생성
CasX 278-280, 285-288, 290, 291, 293, 300, 492 및 493 작제물(표 9에서의 서열)을 생성하기 위해, 포유동물 발현 벡터에서 코돈-최적화된 CasX 119 작제물(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 2의 CasX Stx2 작제물에 기반됨)의 N- 및 C-말단을 조작하여 NLS 서열(표 10에서의 서열)을 결실하거나 추가한다. 작제물 278, 279 및 280은 SV40 NLS 서열만을 사용한 N-말단 및 C-말단의 조작이었다. 작제물 280은 N-말단 상에 NLS가 없었고 두 SV40 NLS 서열 사이에 삼중 프롤린 링커를 갖는 C-말단 상에 2개의 SV40 NLS'를 추가했다. 작제물 278, 279 및 280은 각각 제1 단편에 대해 프라이머 oIC527 및 oIC528, oIC730 및 oIC522, 및 oIC730 및 oIC530을 사용하고 각각 제2 단편을 생성하기 위해 oIC529 및 oIC520, oIC519 및 oIC731, 및 oIC529 및 oIC731을 사용하여 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제로 pStx34.119.174.NT를 증폭함에 의해 제작했다. 이들 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의해 정제되었다. 각 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 클로닝되었다. pStx34에서 어셈블리된 생성물을, 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환하고 37℃에서 인큐베이션했다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유한 LB-아가 플레이트 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat #C2984I)과 같은 화학적으로- 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
작제물 285-288, 290, 291, 293 및 300을 생성하기 위해, 내포 PCR 방법이 클로닝을 위해 사용되었다. 사용된 백본 벡터 및 PCR 주형은 CasX 119, 가이드 174 및 비-표적화 스페이서를 갖는 작제물 pStx34 279.119.174.NT였다(서열에 대해서는 실시예 8 및 9와 그 안의 표 참조). 작제물 278은 구성 SV40NLS-CasX119를 갖는다. 작제물 279는 구성 CasX119-SV40NLS를 갖는다. 작제물 280은 구성 CasX119-SV40NLS-PPP 링커-SV40NLS를 갖는다. 작제물 285는 구성 CasX119-SV40NLS-PPP 링커-SynthNLS3을 갖는다. 작제물 286은 구성 CasX119-SV40NLS-PPP 링커-SynthNLS4를 갖는다. 작제물 287은 구성 CasX119-SV40NLS-PPP 링커-SynthNLS5를 갖는다. 작제물 288은 구성 CasX119-SV40NLS-PPP 링커-SynthNLS6을 갖는다. 작제물 290은 구성 CasX119-SV40NLS-PPP 링커-EGL-13 NLS를 갖는다. 작제물 291은 구성 CasX119-SV40NLS-PPP 링커-c-Myc NLS를 갖는다. 작제물 293은 구성 CasX119-SV40NLS-PPP 링커-핵소체 RNA 헬리카제 II NLS를 갖는다. 작제물 300은 구성 CasX119-SV40NLS-PPP 링커-인플루엔자 A 단백질 NLS를 갖는다. 작제물 492는 구성 SV40NLS-CasX119-SV40NLS-PPP 링커-SV40NLS를 갖는다. 작제물 493은 구성 SV40NLS-CasX119-SV40NLS-PPP 링커-c-Myc NLS를 갖는다. 각 변이체는 3개의 PCR 세트를 가지며; 그 중 2개는 내포되어 겔 추출에 의해 정제되고, 단리된 다음 단리 및 정제된 백본 안으로 결찰되었다. pStx34에서 어셈블리된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열이 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 생성된 pStX 안으로 클로닝했다. 골든 게이트 생성물은, 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat #C2984I)과 같은 화학적으로- 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
작제물 492 및 493을 생성하기 위해, 작제물 280 및 291을 제조업체의 프로토콜에 따라 XbaI 및 BamHI(NEB# R0145S 및 NEB# R3136S)를 사용하여 단리하였다. 다음으로, 이들을 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제했다. 마지막으로, 이들을 제조업체의 프로토콜에 따라 T4 DNA 리가제(NEB# M0202S)를 사용하여 Zymoclean Gel DNA Recovery Kit와 XbaI 및 BamHI를 사용하여 단리되고 정제된 pStx34.119.174.NT 안으로 결찰했다. pStx34에서 어셈블리된 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 스페이서 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 각 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 각 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat #C2984I)과 같은 화학적으로- 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 플라스미드는 실시예 1 및 2의 일반적인 방법론을 이용하여 CasX 단백질을 생산하고 회수하는 데 사용된다.
[표 9]: CasX 278-280, 285-288, 290, 291, 293, 300, 492 및 493 서열
[표 10]: 핵 위치화 서열 목록
실시예 5: CasX 작제물 387, 395, 485-491 및 494의 설계 및 생성
CasX 395, CasX 485, CasX 486, CasX 487을 생성하기 위해, 코돈 최적화된 CasX 119(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는, 실시예 2의 CasX 37 작제물에 기반됨), CasX 435, CasX 438 및 CasX 484(융합된 NLS, 및 연결된 가이드 및 비-표적화 서열을 갖는 L379R 치환, A708K 치환 및 [P793] 결실과 함께, 플랑크토마이세테스 CasX 서열번호: 2를 인코딩하는 실시예 2의 CasX 119 작제물에 기반됨)가 표준 클로닝 방법을 사용하여 KanR 마커, colE1 ori 및 융합된 NLS가 있는 CasX(pStx1)를 포함하는 4kb 병기 벡터 안으로 각각 클로닝되었다. Gibson 프라이머는 각각 pStx1에서 CasX 119, CasX 435, CasX 438 및 CasX 484 상의 이 상응하는 영역(aa 193-332)을 대체하기 위해 그 자체 벡터에서 아미노산 192-331로부터 CasX 서열번호: 1 나선형 I 도메인을 증폭하도록 설계되었다. CasX 서열번호: 1로부터 나선형 I 도메인은 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC768 및 oIC784로 증폭되었다. 원하는 CasX 변이체를 함유하는 대상 벡터는 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC765 및 oIC764로 증폭되었다. 2개의 단편이 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1 병기 벡터에 어셈블리된 생성물은, 카나마이신을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론이 표준 클로닝 방법을 사용하여 절단되고 포유동물 발현 플라스미드(도 5 참조) 안으로 붙여넣어졌다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
관심있는 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 스페이서 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은, 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat # C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
CasX 488, CasX 489, CasX 490 및 CasX 491(표 11에서의 서열)을 생성하기 위해, 코돈 최적화된 CasX 119) CasX 435, CasX 438 및 CasX 484(각각 실시예 2의 CasX119 작제물에 기반됨)를 표준 클로닝 방법을 사용하여 KanR 마커, colE1 ori 및 융합된 NLS가 있는 STX(pStx1)로 구성된 4kb 병기 벡터 안으로 각각 클로닝했다. Gibson 프라이머는 각각 pStx1에서 CasX 119, CasX 435, CasX 438, 및 CasX 484 상의 이 유사한 영역(aa 103-332)을 대체하기 위해 그 자체 벡터에서 아미노산 101-191로부터의 CasX Stx1 NTSB 도메인 및 아미노산 192-331로부터의 나선형 I 도메인을 증폭하도록 설계되었다. CasX 서열번호: 1로부터 NTSB 및 나선형 I 도메인은 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC766 및 oIC784로 증폭되었다. 원하는 CasX 변이체를 함유하는 대상 벡터는 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC762 및 oIC765로 증폭되었다. 2개의 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1 병기 벡터에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론은 표준 클로닝 방법을 사용하여 절단되고 포유동물 발현 플라스미드(도 5 참조) 안으로 붙여넣어졌다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 스페이서 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 스페이서 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat # C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
CasX 387 및 CasX 494(표 11에서의 서열)를 생성하기 위해, 코돈 최적화된 CasX 119 및 CasX 484를 표준 클로닝 방법을 사용하여 KanR 마커, colE1 ori 및 융합된 NLS를 갖는 STX(pStx1)로 구성된 4kb 병기 벡터 안으로 각각 클로닝하였다. Gibson 프라이머는 그 자체 벡터에서 아미노산 101-191로부터 CasX Stx1 NTSB 도메인을 증폭하여 각각 pStx1에서의 CasX 119 및 CasX 484 상의 이 유사한 영역(aa 103-192)을 대체하도록 설계되었다. CasX Stx1로부터의 NTSB 도메인은 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC766 및 oIC767로 증폭되었다. 원하는 CasX 변이체를 함유하는 대상 벡터는 제조업체의 프로토콜에 따라 Q5 DNA 폴리머라제를 사용하여 프라이머 oIC763 및 oIC762로 증폭되었다. 2개의 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 그런 다음 삽입물과 백본 단편은 제조업체의 프로토콜에 따라 Gibson 어셈블리(New England BioLabs Cat# E2621S)를 사용하여 함께 이어맞추어졌다. pStx1 병기 벡터에서 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 그런 다음 올바른 클론이 표준 클로닝 방법을 사용하여 절단되고 포유동물 발현 플라스미드 안으로 붙여넣어졌다(도 5 참조). 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 관심있는 유전자를 표적화하는 표적화 서열을 인코딩하는 서열은 CasX PAM 위치를 기반으로 설계되었다. 표적화 서열 DNA는 표적화 서열 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고로 주문되었다(Integrated DNA Technologies). 이들 두 올리고를 함께 어닐링하고 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 플라스미드에 대한 적절한 제한 효소를 사용하여 골든 게이트 어셈블리에 의해 개별적으로 또는 대량으로 pStX 안으로 클로닝했다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, NEB Turbo 컴피턴트 대장균(NEB Cat # C2984I)과 같은 화학적으로 또는 전기-적격인 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 Qiagen 스핀 미니프렙 키트를 사용하고 제조업체의 프로토콜에 따라 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 생성된 작제물의 서열은 표 11에 나열되어 있다.
[표 11]: CasX 395 및 485-491의 서열
실시예 6: RNA 가이드의 생성
RNA 단일 가이드 및 스페이서의 생성을 위해, 시험관내 전사를 위한 주형을 각 백본에 대한 주형 올리고 및 T7 프로모터와 스페이서 서열을 갖는 증폭 프라이머로, 권장 프로토콜에 따라 Q5 폴리머라제(NEB M0491)로 PCR을 수행함에 의해 생성했다. T7 프로모터, 가이드 및 가이드에 대한 스페이서 및 스페이서에 대한 DNA 프라이머 서열은 하기 표 12에 제시되어 있다. 각 스캐폴드에 대해 "백본 fwd" 및 "백본 rev"로 표지된 주형 올리고는 각각 20nM의 최종 농도로 포함되었고 증폭 프라이머(T7 프로모터 및 고유한 스페이서 프라이머)는 각각 1μM의 최종 농도로 포함되었다. sg2, sg32, sg64 및 sg174 가이드는 각각 서열번호: 5, 600, 602 및 734에 해당하지만 단, sg2, sg32 및 sg64는 (표 2에 대해 표 12에서의 서열을 비교하여) 전사 효율을 증가시키기 위해 추가 5' G로 변형되었다는 제외가 있다. 7.37 스페이서는 베타2-마이크로글로불린(B2M)을 표적화한다. PCR에 이어서 주형을 세정하고 페놀-클로로포름-이소아밀 알코올 추출 후 에탄올 침전에 의해 단리했다.
시험관내 전사는 50mM Tris pH 8.0, 30mM MgCl2, 0.01% Triton X-100, 2mM 스페르미딘, 20mM DTT, 5mM NTP, 0.5μM 주형 및 100μg/mL T7 RNA 폴리머라제를 함유하는 완충액에서 수행되었다. 반응물을 37℃에서 밤새 인큐베이션하였다. 20 유닛의 DNase I(Promega #M6101))을 전사 부피 1mL당 첨가하고 1시간 동안 인큐베이션했다. RNA 생성물을 변성 PAGE를 통해 정제하고, 에탄올 침전시키고, 1X 인산염 완충 식염수에 재현탁시켰다. sgRNA를 폴딩하기 위해 샘플을 70℃로 5분 동안 가열한 다음 실온으로 냉각했다. 반응물을 1mM 최종 MgCl2 농도로 보충하고, 50℃로 5분 동안 가열한 다음, 실온으로 냉각시켰다. 최종 RNA 가이드 생성물은 -80℃에서 보관되었다.
[표 12]: 가이드 RNA의 생성을 위한 서열
실시예 7: 가이드 RNA에 대한 결합 친화도 평가
정제된 야생형 및 개선된 CasX는 비-특이적 결합 및 응집을 방지하기 위해 염화마그네슘 뿐만 아니라 헤파린을 함유하는 저염 완충액에서 3' Cy7.5 모이어티를 함유하는 합성 단일-가이드 RNA와 함께 인큐베이션될 것이다. sgRNA는 10pM의 농도로 유지되는 반면, 단백질은 별도의 결합 반응에서 1pM에서 100μM로 적정될 것이다. 반응이 평형을 이루도록 한 후, 샘플은 각각 단백질과 핵산을 결합하는 니트로셀룰로오스 멤브레인 및 양으로 하전된 나일론 멤브레인을 사용한 진공 매니폴드 필터-결합 검정을 통해 실행될 것이다. 멤브레인은 가이드 RNA를 식별하기 위해 이미지화되고 결합된 RNA 대 결합되지 않은 RNA의 분율은 단백질-sgRNA 복합체의 해리 상수를 계산하기 위해 각 단백질 농도에 대한 니트로셀룰로오스 대 나일론 멤브레인 상의 형광의 양에 의해 결정될 것이다. 실험은 또한 이들 돌연변이가 야생형 및 돌연변이체 단백질에 대한 가이드의 친화도에 영향을 미치는지 여부를 결정하기 위해 sgRNA의 개선된 변이체로 수행될 것이다. 본 발명자들은 또한 전기이동성 전이 검정을 수행하여 필터-결합 검정과 질적으로 비교하고 응집보다는 가용성 결합이 단백질-RNA 회합에 대한 주요 기여자임을 확인할 것이다.
실시예 8: 표적 DNA에 대한 결합 친화도 평가
정제된 야생형 및 개선된 CasX는 표적 핵산에 상보성인 표적화 서열을 담지하는 단일-가이드 RNA와 복합체화될 것이다. RNP 복합체는 비-특이적 결합 및 응집을 방지하기 위해 PAM을 함유하는 이중-가닥 표적 DNA 및 염화마그네슘 뿐만 아니라 헤파린을 함유하는 저염 완충액에서 표적 가닥 상에 5' Cy7.5 라벨이 있는 적절한 표적 핵산 서열과 함께 인큐베이션될 것이다. 표적 DNA는 1nM의 농도로 유지되는 반면, RNP는 별도의 결합 반응에서 1pM에서 100μM로 적정될 것이다. 반응이 평형을 이루도록 한 후, 샘플은 결합된 표적 DNA와 결합되지 않은 표적 DNA를 분리하기 위해 천연 5% 폴리아크릴아미드 겔 상에서 실행될 것이다. 겔은 표적 DNA의 이동성 전이를 식별하기 위해 이미지화되고, 결합된 DNA 대 결합되지 않은 DNA의 분율은 RNP-표적 DNA 삼원 복합체의 해리 상수를 결정하기 위해 각 단백질 농도에 대해 계산될 것이다.
실시예 9: CasX:gNA 시험관내 절단 검정
1. 야생형 참조 CasX와 비교하여 단백질 변이체에 대한 절단-적격 분획 결정
참조 CasX와 비교하여 활성 RNP를 형성하는 CasX 변이체의 능력은 시험관내 절단 검정을 사용하여 결정되었다. 절단 검정을 위한 베타-2 마이크로글로불린(B2M) 7.37 표적은 다음과 같이 생성되었다. 서열 TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(비-표적 가닥, NTS(서열번호: 415)) 및 TGAAGCTGACAGCATTCGGGCCGAGATGTCTCGCTCCGTGGCCTTAGCTGTGCTCGCGCT(표적 가닥, TS (서열번호: 416))를 갖는 DNA 올리고가 5' 형광성 라벨(각각 LI-COR IRDye 700 및 800)과 함께 구입되었다. dsDNA 표적은 1x 절단 완충액(20mM Tris HCl pH 7.5, 150mM NaCl, 1mM TCEP, 5% 글리세롤, 10mM MgCl2)에서 1:1 비율로 올리고를 혼합하고 95℃로 10분 동안 가열하고, 용액을 실온으로 냉각되도록 함에 의해 형성되었다.
CasX RNP는 사용할 준비가 될 때까지 얼음으로 옮기기 전에 10분 동안 37℃에서 1× 절단 완충액(20mM Tris HCl pH 7.5, 150mM NaCl, 1mM TCEP, 5% 글리세롤, 10mM MgCl2)에서 달리 명시되지 않는 한 표시된 가이드의 1.5-배 과잉으로 1μM의 최종 농도에서 표시된 CasX 및 가이드(그래프 참조)로 재구성했다. 7.37 표적에 상보적인 스페이서를 갖는 sgRNA와 함께 7.37 표적이 사용되었다.
절단 반응은 100nM의 최종 RNP 농도 및 100nM의 최종 목표 농도로 준비되었다. 반응은 37℃에서 수행되었고 7.37 표적 DNA의 첨가에 의해 개시되었다. 5, 10, 30, 60 및 120분에 분취량을 취하고 95% 포름아미드, 20mM EDTA를 첨가하여 켄칭했다. 샘플을 95℃에서 10분 동안 가열하여 변성시키고 10% 우레아-PAGE 겔 상에서 수행했다. 겔은 LI-COR Odyssey CLx로 이미지화하고 LI-COR Image Studio 소프트웨어를 사용하여 정량화하거나 Cytiva Typhoon으로 이미지화하고 Cytiva IQTL 소프트웨어를 사용하여 정량화했다. 결과 데이터는 Prism을 사용하여 플롯팅되고 분석되었다. 본 발명자들은 CasX가 검정된 조건 하에서 본질적으로 단일-전환 효소로 작용한다고 가정했는데, 이는 화학양론적 양 이하의 효소가 연장된 시간-규모 하에서도 화학양론적 양보다 많은 양의 표적을 절단하지 못하고 대신에 존재하는 효소의 양에 따라 확장하는 정체기에 접근한다는 관찰에 의해 나타난 바와 같다. 따라서, 등몰량의 RNP에 의해 긴 시간-규모에 걸쳐 절단된 표적의 분율은 RNP의 어느 분율이 적절하게 형성되고 절단에 대해 활성인지를 나타낸다. 절단 반응은 이 농도 체제 하에서 단상에서 분명히 벗어나기 때문에 절단 흔적은 2상 속도 모델에 적합했고 3개의 독립적인 복제물 각각에 대해 정체기를 결정했다. 활성 분율을 결정하기 위해 평균 및 표준 편차를 계산했다(표 13). 그래프는 도 15에 도시되어 있다.
겉보기 활성(적격) 분율은 CasX2 + 가이드 174 + 7.37 스페이서, CasX119 + 가이드 174 + 7.37 스페이서, CasX457 + 가이드 174 +7.37 스페이서, CasX488 + 가이드 174 + 7.37 스페이서, 및 CasX491 + 가이드 174 + 7.37 스페이서에 대해 형성된 RNP에 대해 결정되었다. 결정된 활성 분율은 표 13에 나타나 있다. 모든 CasX 변이체는 야생형 CasX2보다 활성 분율이 더 높았으며, 이는 조작된 CasX 변이체가 야생형 CasX와 비교하여 시험된 조건 하에서 동일한 가이드를 사용하여 유의하게 더 활성이고 안정적인 RNP를 형성함을 나타낸다. 이것은 sgRNA에 대한 증가된 친화도, sgRNA의 존재에서 증가된 안정성 또는 용해도, 또는 조작된 CasX:sgRNA 복합체의 절단-적격인 형태의 더 큰 안정성 때문일 수 있다. RNP의 용해도에서의 증가는 CasX2와 비교하여 CasX457, CasX488 또는 CasX491이 sgRNA에 추가될 때 형성된 관찰된 침전물의 현저한 감소에 의해 표시되었다.
2. 시험관내 절단 검정 - 야생형 참조 CasX와 비교하여 CasX 변이체에 대한 k절단 결정
절단-적격인 분율은 또한, 도 16 및 표 13에 나타난 바와 같이, CasX2.2.7.37, CasX2.32.7.37, CasX2.64.7.37 및 CasX2.174.7.37에 대해 동일한 프로토콜을 사용하여 16 ± 3%, 13 ± 3%, 5 ± 2%, 및 22 ± 5%인 것으로 결정되었다.
가이드의 제2 세트는 RNP 형성에 대한 가이드의 기여를 더 잘 단리하기 위해 다른 조건 하에서 시험되었다. 7.37 스페이서를 갖는 174, 175, 185, 186, 196, 214 및 215 가이드를 이전과 같이 과잉 가이드보다는, 가이드의 경우 1μM 및 단백질의 경우 1.5μM의 최종 농도로 CasX491과 혼합했다. 결과는 도 17 및 표 13에 나타나 있다. 이들 가이드 중 다수는 174보다 추가 개선을 나타내어, 185 및 196은 이들 가이드-제한 조건 하에서 174에 대한 80 ± 9%와 비교하여 각각 91 ± 4% 및 91 ± 1% 적격인 분율을 달성했다.
데이터는 CasX 변이체 및 sgRNA 변이체 둘 모두가 야생형 CasX 및 야생형 sgRNA와 비교하여 가이드 RNA와 함께 더 높은 정도의 활성 RNP를 형성할 수 있음을 나타낸다.
야생형 참고 CasX와 비교한 CasX 변이체 119, 457, 488 및 491의 겉보기 절단 속도는 표적 7.37의 절단에 대한 시험관내 형광 검정을 사용하여 결정되었다.
CasX RNP는 사용할 준비가 될 때까지 얼음으로 옮기기 전에 37℃에서 10분 동안 1× 절단 완충액(20mM Tris HCl pH 7.5, 150mM NaCl, 1mM TCEP, 5% 글리세롤, 10mM MgCl2)에서 표시된 가이드의 1.5-배 과량으로 1μM의 최종 농도에서 표시된 CasX(도 18 참조)로 재구성되었다. 절단 반응은 200nM의 최종 RNP 농도 및 10nM의 최종 표적 농도로 설정되었다. 달리 언급되고 표적 DNA의 첨가에 의해 개시되는 경우를 제외하고 반응을 37℃에서 수행되었다. 분취량을 0.25, 0.5, 1, 2, 5 및 10분에 취하고 95% 포름아미드, 20mM EDTA를 첨가하여 켄칭했다. 샘플을 95℃에서 10분 동안 가열함에 의해 변성시키고 10% 우레아-PAGE 겔 상에서 수행했다. 겔을 LI-COR Odyssey CLx로 이미지화하고 LI-COR Image Studio 소프트웨어를 사용하여 정량화하거나 Cytiva Typhoon으로 이미지화하고 Cytiva IQTL 소프트웨어를 사용하여 정량화했다. 얻어진 데이터를 플롯팅하고 Prism을 사용하여 분석하였고, 각 CasX:sgRNA 조합 복제물에 대해 비-표적 가닥 절단(k절단)의 명백한 1차 속도 상수를 개별적으로 결정했다. 독립적인 적정을 갖는 3회 반복의 평균 및 표준 편차가 표 13에 제시되어 있고, 절단 흔적이 도 18에 도시되어 있다.
겉보기 절단 속도 상수는 각 검정에서 이용된 가이드 174 및 스페이서 7.37로 야생형 CasX2, 및 CasX 변이체 119, 457, 488 및 491에 대해 결정되었다(표 13 및 도 18 참조). 모든 CasX 변이체는 야생형 CasX2에 비해 절단 속도가 개선되었다. CasX457은 상기에서 결정된 바와 같이 더 높은 적격 분율을 가짐에도 불구하고 119보다 더 느리게 절단되었다. CasX488 및 CasX491은 큰 차이로 가장 높은 절단 속도를 가졌다; 표적이 제1 시점에서 거의 완전히 절단되었기 때문에, 실제 절단 속도는 이 검정의 분해능을 초과하고 보고된 k절단은 하한으로 취해야 한다.
데이터는 CasX 변이체가 더 높은 활성 수준을 가지며, k절단 속도는 야생형 CasX2에 비해 적어도 30-배 더 높게 도달한다는 것을 나타낸다.
3. 시험관내 절단 검정: 가이드 변이체와 야생형 가이드의 비교
절단 검정을 또한 가이드 변이체 32, 64, 및 174와 비교하여 야생형 참고 CasX2 및 참고 가이드 2로 수행하여 변이체가 절단을 개선했는지 여부를 결정하였다. 실험은 상기에 기술된 바와 같이 수행되었다. 생성된 RNP의 대부분이 시험된 시간에 표적의 완전한 절단에 접근하지 않았기 때문에, 본 발명자들은 1차 속도 상수가 아닌 초기 반응 속도(V0)를 결정했다. 처음 2개의 시점(15초 및 30초)은 각 CasX:sgRNA 조합 및 복제에 대한 라인으로 적정되었다. 3회 반복에 대한 기울기의 평균 및 표준 편차가 결정되었다.
검정된 조건 하에서, 가이드 2, 32, 64, 및 174를 갖는 CasX2에 대한 V0는 20.4 ± 1.4nM/분, 18.4 ± 2.4nM/분, 7.8 ± 1.8nM/분, 및 49.3 ± 1.4nM/분이었다(표 13 및 도 19 및 도 20 참조). 가이드 174는 생성된 RNP의 절단 속도에서 상당한 개선을 보인 반면(2에 비해 ~2.5-배, 도 20 참조), 가이드 32 및 64는 가이드 2와 유사하거나 더 나쁘게 수행되었다. 현저하게, 가이드 64는 가이드 2보다 낮은 절단 속도를 지원하지만 생체내에서 훨씬 더 양호하게 수행한다(데이터는 표시되지 않음). 가이드 64를 생성하기 위한 일부의 서열 변경은 삼중체 형성에 관여하는 뉴클레오티드를 희생시키면서 생체내 전사를 개선할 가능성이 있다. 가이드 64의 개선된 발현은 생체내에서 그 개선된 활성을 설명하기 쉬운 반면, 그 감소된 안정성은 시험관내에서 부적절한 폴딩으로 이어질 수 있다.
추가적 실험은 상대적인 절단 속도를 결정하기 위해 스페이서 7.37 및 CasX491을 갖는 가이드 174, 175, 185, 186, 196, 214 및 215로 수행했다. 본 발명자들의 검정으로 측정가능한 범위로 절단 동역학을 감소시키기 위해, 절단 반응을 10℃에서 인큐베이션하였다. 결과는 도 21 및 표 13에 있다. 이들 조건 하에서, 215는 174보다 빠른 절단 속도를 지원하는 유일한 가이드였다. 가이드-제한 조건 하에서 RNP의 가장 높은 활성 분율을 나타내는 196은 174와 본질적으로 동일한 동역학을 가져, 상이한 변이체가 뚜렷한 특성의 개선을 초래한다는 것을 다시 강조한다.
데이터는 검정의 조건 하에서 CasX를 갖는 대부분의 가이드 변이체의 사용은 ~2-배에서 >6-배까지의 범위인 초기 절단 속도에서의 개선으로, 야생형 가이드를 갖는 것보다 활성 수준이 더 높은 RNP를 초래한다는 것을 뒷받침한다. 표 13에서 숫자는 왼쪽에서 오른쪽으로 RNP 작제물의 CasX 변이체, sgRNA 스캐폴드 및 스페이서 서열을 나타낸다. 아래 표에서 RNP 작제물 명칭에서, CasX 단백질 변이체, 가이드 스캐폴드 및 스페이서는 왼쪽에서 오른쪽으로 표시된다.
[표 13]: 절단 및 RNP 형성 검정의 결과
*평균 및 표준편차
실시예 10:
시험관내
차등 PAM 인식 평가
sg174.7.37과 복합체화된 CasX2, CasX119, 및 CasX438을 사용하여, 본질적으로 실시예 9에 기재된 바와 같은 시험관내 절단 검정을 수행하였다. 7.37 스페이서 및 TTC, CTC, GTC 또는 ATC PAM을 갖는 형광으로 표지된 dsDNA 표적이 사용되었다(서열은 표 14에 있음). 시점은 0.25, 0.5, 1, 2, 5, 10, 30 및 60분에서 취해졌다. 겔은 Cytiva Typhoon으로 이미지화되었고 IQTL 8.2 소프트웨어를 사용하여 정량화되었다. 비-표적 가닥 절단(k절단)에 대한 겉보기 1차 속도 상수는 각 표적 상의 각 Casx:sgRNA 복합체에 대해 결정되었다. 비-TTC PAM을 갖는 표적에 대한 속도 상수를 TTC PAM 표적과 비교하여 각 PAM에 대한 상대적 선호도가 주어진 단백질 변이체에서 변경되었는지 여부를 결정했다.
모든 변종에 대해, TTC 표적이 가장 높은 절단 속도를 지원하고, ATC, 그 다음이 CTC, 마지막으로 GTC 표적이 뒤따랐다(도 22a-d, 표 15). CasX 변이체와 NTC PAM의 각 조합에 대해, 절단 속도 k절단이 표시된다. 모든 비-NTC PAM의 경우, 해당 변이체에 대한 TTC 속도와 비교한 상대 절단 속도가 괄호 안에 표시된다. 모든 비-TTC PAM은 실질적으로 감소된 절단 속도를 나타냈다(모두에 대해 >10-배). 특정 변이체에 대한 TTC PAM과 주어진 비-TTC PAM의 절단 속도 사이의 비율은 모든 변이체에 걸쳐 일반적으로 일관되게 유지되었다. CTC 표적은 TTC 표적만큼 빠르게 절단을 3.5-4.3% 지원했다; GTC 표적은 빠르게 절단을 1.0-1.4% 지원했다; 그리고 ATC 표적은 빠르게 절단을 6.5-8.3% 지원했다. TTC PAM에서 절단의 동역학이 너무 빨라 정확한 측정을 허용하지 않아, TTC와 비-TTC PAM 사이의 명백한 차이를 인위적으로 감소시키는 491의 경우는 예외이다. 측정가능한 범위 내에 속하는 GTC, CTC 및 ATC PAM에서 491의 상대적인 속도를 비교하면, 비-TTC PAM에 걸쳐 비교할 때 다른 변이체에 대한 것들에 필적할만한 비율을 초래하며, 이는 나란히 증가하는 속도와 일치한다. 전반적으로 변이체 간의 차이는 다양한 NTC PAM에 대한 상대적 선호도가 변경되었음을 시사할 만큼 충분히 실질적이지는 않다. 그러나, 변이체의 더 높은 기저 절단 속도는 ATC 또는 CTC PAM을 갖는 표적이 10분 이내에 거의 완전히 절단되도록 하고, 겉보기 k절단은 TTC PAM에서 CasX2의 k절단과 비슷하거나 더 크다(표 14). 이 증가된 절단 속도는 인간 세포에서 효과적인 게놈 편집에 필요한 임계치를 가로지를 수 있으며, 이는 이들 변이체에 대한 PAM 유연성에서의 겉보기 증가를 설명한다.
[표 14].
시험관내
PAM 절단 검정에 사용된 DNA 기질의 서열.
*각각에 대한 PAM 서열은 굵게 표시된다. TS ― 표적 가닥. NTS ― 비-표적 가닥.
[표 15]. NTC PAM에 대한 CasX 변이체의 겉보기 절단 속도.
실시예 11: 닉킹 변이체의 동정
정제된 변형된 CasX 변이체는 고정된 표적화 서열을 담지하는 단일-가이드 RNA와 복합체화될 것이다. RNP 복합체는 100nM의 최종 농도에서 MgCl2를 함유하는 완충액에 첨가될 것이고, 표적 가닥에 5' 형광 표지 및 비-표적 가닥에 5' Cy5 표지가 10nM의 농도로 있는 이중-가닥 표적 DNA와 함께 인큐베이션될 것이다. 반응의 분취량을 고정된 시점에서 취하고 동일한 부피의 50mM EDTA 및 95% 포름아미드의 첨가에 의해 켄칭될 것이다. 샘플은 변성 폴리아크릴아미드 겔에서 수행되어 절단된 DNA 기질과 절단되지 않은 DNA 기질을 분리한다. 한 가닥이 효율적으로 절단되지만 다른 가닥은 절단되지 않는다는 것은 변이체가 단일-가닥 닉카제 활성을 갖고 있음을 나타낸다.
실시예 12: RNP 생산을 위한 CasX 변이체의 개선된 발현 및 용해도 특성 평가
야생형 및 변형된 CasX 변이체는 동등한 조건 하에서 BL21(DE3) 대장균에서 발현될 것이다. 모든 단백질은 IPTG-유도성 T7 프로모터의 제어 하에 있을 것이다. 세포는 37℃에서 TB 배지에서 OD 0.6으로 성장할 것이고, 이 시점에서 성장 온도는 16℃로 감소하고 0.5mM IPTG의 첨가에 의해 발현이 유도될 것이다. 세포는 발현 18시간 후에 수확될 것이다. 가용성 단백질 분획을 추출하고 SDS-PAGE 겔 상에서 분석할 것이다. 가용성 CasX 발현의 상대적 수준은 쿠마시 염색에 의해 동정될 것이다. 단백질은 상기 프로토콜에 따라 병렬로 정제되고 순수 단백질의 최종 수율이 비교될 것이다. 정제된 단백질의 용해도를 결정하기 위해, 작제물은 단백질이 침전되기 시작할 때까지 저장 완충액에 농축될 것이다. 침전된 단백질은 원심분리에 의해 제거되고 가용성 단백질의 최종 농도는 각 변이체에 대한 최대 용해도를 결정하기 위해 측정될 것이다. 마지막으로, CasX 변이체는 단일 가이드 RNA와 복합체화되고 침전이 시작될 때까지 농축될 것이다. 침전된 RNP는 원심분리에 의해 제거되고 가용성 RNP의 최종 농도는 가이드 RNA에 결합될 때 각 변이체의 최대 용해도를 결정하기 위해 측정될 것이다.
실시예 13: XDP 작제물, 형질감염 및 회수.
플라스미드 및 세포주
tdTomato를 표적화하는 스페이서 서열 12.7(CTGCATTCTAGTTTGTGTTTT에 의해 인코딩됨, 서열번호: 825)을 갖는 단일 가이드 RNA 174 및 CasX, CasX 119, CasX 438 또는 CasX 457 단백질의 RNP를 함유하는 CasX 전달 입자(XDP)는 도 23에 도시되고 표 16에 나열된 4개의 플라스미드(CasX가 이용되는 것에 따라 다른 플라스미드를 가짐)를 사용한 LentiX HEK293T 세포(Takara Biosciences)의 일시적인 형질감염에 의해 생성되었다. pStx43 플라스미드는 Gag 폴리단백질 서열과 이어지는 C-말단에서 융합된 CasX 단백질(pXD10은 CasX 119를 인코딩하고; pXD11은 CasX 438을 인코딩하고; pXD12는 CasX 457을 인코딩함)을 함유한다. SQNYPIVQ(서열번호: 20) HIV-1 절단 부위는 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 Gag 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서의 스캐폴드 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림을 사용하여 생성되었다. 또 다른 pStx42 플라스미드를 이용하여 스캐폴드 및 비-표적화 스페이서 성분을 갖는 CasX 가이드 카세트를 만들고, 편집 검정에서 대조군으로 사용했다. XDP 및 Gag-Pol(psPax2) 단백질을 위형화하기 위한 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 내에 합체된 서열은 표 16에 제시되어 있다.
[표 16]: 플라스미드 인코딩 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 10cm 접시에 접종했다. 세포를 형질감염 전에 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해, 다음 플라스미드 양이 사용되었다: 19.8μg의 pXDP10, pXDP11, 또는 pXDP12. 5μg의 pStx42.174.12.7, 3.3μg의 psPax2, 및 1μg의 pGP2로 680μl의 Opti-MEM 배지 내. 87.5μl의 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 그 다음 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 10mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과 후 남은 대략적으로 8mL 중 1mL는 적정 및 후속 검정을 위해 4℃에 보관했다. 나머지 여과된 상등액은 세포 편집에 직접적으로 사용하거나 아래에 기술된 대로 NTE 중 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 10,000 x g에서 원심분리하여 농축했다.
실시예 14: XDP의 정제
XDP 생산을 위한 다양한 실시예에 기재된 바와 같이, 생산 세포는 가습된 5% CO2 분위기에서 37℃에서 10% 소 태아 시스템이 보충된 DMEM에서 유지되었다. 세포를 형질감염 24시간 전에 15cm 플레이트에 도말하였다. 적절한 플라스미드와 함께 PEI를 사용하여 형질감염을 수행하였다. 배지를 제거하고 형질감염 24시간 후에 6.25U/mL의 벤조나아제를 함유하는 Opti-MEM으로 대체하였다. XDP-함유 상등액은 형질감염 72시간 후에 수집하고 0.45μM PES 필터를 통해 여과한 후 정제할 때까지 4℃에서 보관했다.
원심분리 프로토콜
여과된 상등액을 적당한 수의 원심분리 튜브 또는 병에 고르게 분할하고 수크로스 완충액(50mM Tris-HCL, 100mM NaCl, 10% 수크로스, pH 7.4)의 상등액 부피의 1/5을 혈청학적 피펫을 사용하여 깔았다. 샘플은 무 브레이크로 4시간 동안 스윙-버킷 로터에서 10,000xg, 4℃에서 원심분리되었다. 상등액을 조심스럽게 제거하고 원심분리 용기를 뒤집어서 펠렛을 잠시 건조시켰다. 그런 다음 펠렛을 저장 완충액(PBS + 113mM NaCl, 15% 트레할로스 이수화물, pH 8) 또는 적절한 배지에 부드러운 분쇄 및 볼텍싱에 의해 재현탁했다.
컬럼 프로토콜
여과된 상등액을 4℃에서 FPLC 기기를 사용하여 음이온 교환 크로마토그래피(AEX)로 정제하였다. AEX 컬럼을 완충액 A로 평형화하고, 상등액을 적용하고, 컬럼을 10CV의 완충액 A(100mM Tris-HCl, pH 7.5)로 세정하였다. 결합된 물질은 40 컬럼 부피에 걸쳐 0% - 100% 완충액 B(100mM Tris-HCl, 1M NaCl, pH 7.5)의 구배 용출을 사용하여 용출되었다. XDP-함유 분획을 풀링하고 완충액 C(100mM Tris-HCl, 300mM NaCl, pH 7.5)로 평형화된 CaptoCore 700 컬럼(Cytiva)을 사용하여 추가로 정제했다. 그런 다음 XDP-함유 관류를 실온에서 100kDa 컷오프 스핀 농축기를 사용하여 농축했다. 얻어진 농축 샘플을 저장 완충액 안으로 정용여과하고, 분취하고, 액체 질소에서 급속-동결한 후 -80℃에서 보관했다.
정량화
샘플을 열 수조에서 37℃에서 신속하게 해동하고, 볼텍싱하고, 0.1% Tween 20이 보충된 2xPBS에서 희석했다. 입자 역가 및 크기는 NP150 나노포어에서 qNano Gold TRPS 시스템(Izon Science)을 사용하여 평가되었다.
도 34는 원심분리 정제 공정 전반에 걸쳐 취한 샘플의 대표적인 SDS-PAGE 및 웨스턴 블롯 이미지를 나타낸다. 왼쪽에서 오른쪽으로 레인: 세포: 생산자 세포, 전: 상등액 여과-전, 후: 0.45μM 여과된 상등액, 상등액: 원심분리 후 남은 상등액, 펠렛: 재현탁된 XDP 펠렛. 총 단백질은 StainFree 기술(BioRad)로 시각화되었으며 표시된 항체로 웨스턴 블롯팅을 수행했다. 이들 도면은 XDP가 원심분리나 컬럼 크로마토그래피에 의해 포유동물 생산자 세포 상등액에서 정제되고 농축될 수 있음을 나타낸다. 도 34에서, 전체 단백질 염색은 특정 단백질이 전체 세포 용해물(세포 레인)에서 과도하게 나타나지 않는 상등액에 농축되어 있음을 나타낸다. 전, 후 및 상등액 레인은 구별할 수 없으며, 이는 벌크 단백질이 XDP 펠릿에 집중되지 않음을 나타낸다. 이것은 gag-CasX-HA, VSV-G 및 gag의 분자량과 일치하는 고유 밴드를 갖는 펠릿 레인의 구성에서 변화에 의해 추가로 나타내어 진다. 웨스턴 블롯팅은 이들 결과를 확인하여, 각 레인에 동일한 양의 단백질이 장입되었음에도 불구하고 가장 중요한 염색이 펠릿 레인에 있음을 나타낸다. 두 번째로 가장 어두운 염색은 입력 레인에서 볼 수 있으며, 이 과정에 의해 입자가 집중되어 있음을 나타낸다. 다른 레인에서 염색의 결실은 각 단계에서 단지 미미한 양의 입자만 손실된다는 것을 나타낸다.
평균적으로, 이 정제 공정은 TRPS에 의해 측정된 직경이 평균 113nm인, 밀리리터당 2.48 x 1011 입자의 농도에서 여과된 상등액의 리터당 4.13 x 1012 입자를 산출한다. 이 방식으로 정제된 입자의 평균 활성은 일단 정제되면 mL당 4.27 x 107 편집 단위(EU)였다. 이는 1.42 x 107 EU/L 배양액으로 작동하며, 이는 치료적 사용을 위한 벡터의 생산을 위한 실현가능한 수율이다.
실시예 15: XDP 작제물, 형질감염 및 회수
버전 1-24(표 17 참조)로 명명된 CasX 전달 입자(XDP)의 대안적인 구성 버전은 4개의 상이한 CasX 변이체 단백질; CasX119, CasX438, CasX 457 또는 CasX 491의 RNP를 함유하도록 설계되었으며, tdTomato(CTGCATTCTAGTTGTGGTTT에 의해 인코딩됨, 서열번호: 825)를 표적화하는 스페이서 서열 12.7을 갖는 단일 가이드 RNA 변이체 174와 복합체화되었다. XDP는 아래에 기술된 방법을 사용하여, 하나 이상의 구조적 플라스미드(Gag-Pol HIV-1 시스템의 하나 이상의 성분, 위형화 당단백질을 인코딩하는 플라스미드 및 단일 가이드 RNA를 인코딩하는 플라스미드로부터 유래됨(버전 1을 나타내는, 도 17 참조)를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적인 형질감염에 의해 생산되었다. 버전 번호별로 그룹화된 표 17에는 "디자인" 열에 표시된 성분을 함유하는 XDP의 각 버전을 생성하는 데 사용된 플라스미드 (및 그의 서열)가 나열되어 있고, 도 24는 버전에서 다양한 플라스미드의 조직화의 개략도를 나타낸다. 플라스미드는 실시예 13에 요약된 방법을 이용하여 구성되었다. 가이드 RNA를 인코딩하는 플라스미드의 경우, pStx42 플라스미드는 실시예 13에 기재된 단일-가이드 형식에서 tdTomato에 표적화된 스캐폴드 및 스페이서 성분을 갖는 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. 또 다른 pStx42 플라스미드를 이용하여 편집 검정에서 대조군으로 사용되는 스캐폴드 및 비-표적화 스페이서 성분을 갖는 가이드 RNA 카세트를 만든다. XDP 및 Gag-Pol(psPax2) 단백질을 위형화하기 위한 VSV-G를 인코딩하는 플라스미드(pGP2)도 사용되었다(표 16에서의 대표적인 서열). 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다.
[표 17]: 플라스미드 인코딩 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 10cm 접시에 접종했다. 세포를 형질감염 전에 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해, 680μl의 Opti-MEM 배지에서 5μg의 가이드 플라스미드 및 0.1μg의 pMD2.G와 함께 표 17의 플라스미드. 87.5μl의 1mg/ml 선형 폴리에틸렌이민(PEI, MW=40,000 Da)을 그 다음 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 10mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과 후 남은 대략적으로 8mL 중 1mL는 적정 및 후속 검정을 위해 4℃에 보관했다. 나머지 여과된 상등액은 세포 편집에 직접적으로 사용하거나 NTE 중 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 10,000 x g에서 원심분리하여 농축했다.
실시예 16: XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석을 사용한 수크로스 완충액 농축액, 뿐만 아니라 Opti-MEM 음성 대조군으로부터 10x 농축액으로 표적화 XDP(tdTomato의 경우 스페이서 12.7을 가짐) 및 비-표적화 XDP(비-표적화 스페이서를 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장되었다.
결과: 편집 검정의 결과를 하기 도 25 및 표 18에 나타내었다. 도 25는 단일 실험의 결과를 나타낸다(표적화 XLP는 VSV-g를 갖는 XDP CasX119이고; Bald VLP는 GP 없는 XDP CasX119이고; 그리고 음성 대조군은 표 18에 표지된 바와 같은 완충액 대조군인 반면, 표는 dtTomato 표적 서열의 20% 편집이 CasX 119 작제물을 포함하는 XDP로 달성되었음을 보여주는 3회 실험의 평균 결과를 나타낸다.
[표 18]: 편집 검정의 결과
실시예 17: 향성 및 편집 능력을 평가하기 위해 합체된 당단백질을 갖는 XDP의 구축
렌티바이러스 및 레트로바이러스 벡터를 포함하는 바이러스 벡터는 가장 흔히 광범위한 숙주 세포 범위와 높은 벡터 입자 안정성 둘 모두를 부여하는 당단백질인; 수포성 구내염 바이러스(VSV-G)의 외피 단백질로 위형화되었다. 마우스 신경 전구 세포(tdT NPC)에서 tdTomato 편집에 특이적인 CasX의 RNP와 gNA가 합체된 XDP가 다양한 농도의 합체된 VSV-G로 생성되어 VSV-G에 의한 편집 모이어티의 향상된 전달을 통한 tdT NPC에서 편집에 대한 상응하는 효과를 결정하는 실험이 수행되었다.
도 26-28에 도시된 실험은 XDP 생산 방법(tdT에 표적화된 스페이서 서열 12.7을 갖는 CasX 119 및 단일 가이드 RNA 174의 경우) 및 적용가능한 경우 실시예 13 및 15에 자세히 설명된 시험 절차를 따른다. 서열은 표 19에 나타나 있다. 도 26a 및 26b에서의 데이터를 초래하는 실험을 위해, XDP에 합체된 다양한 농도의 위형별(VSV-G) 플라스미드의 효과는 다음과 같이 평가되었다: 1μg의 VSV-G 플라스미드는 100% VSV-G 그룹에 사용되었고, 0.3μg은 30% VSV-G 그룹에 사용되고, 0.1μg은 10% VSV-G 그룹에 사용되었고, 0.03μg은 3% VSV-G 그룹에 사용되고, 0.01μg은 1% VSV-G 그룹에 사용되고, 0.003μg은 0.3% VSV-G 그룹에 사용되었다. 생산된 XDP의 역가측정은 Takara p24 급속 역가 키트를 사용하여 수행되었다. 편집은 실시예 16에 자세히 기술된 바와 같이 tdTomato NPC 세포에서 평가되었다.
10% 및 30% VSV-G 그룹에 대한 결과는, 도 26b에 도시된 바와 같이 바이러스 역가 또는 안정성에 영향을 미치지 않으면서, 도 26a에 도시된 바와 같이 100% VSV-G 그룹과 비교하여 더 나은 편집 결과를 향한 경향이 있다.
결과에 따르면 실험 조건 하에서 100% VSV-G 그룹과 비교하여 10-30% VSV-G로 더 높은 편집은 아니더라도 동일하게 달성할 수 있으며, 이는 VSV-G가 있거나 없는 다른 인코딩된 당단백질로 XDP 입자를 위형화하는 가능성을 열어, 본 명세서에 개시된 바이러스 당단백질을 포함하는, 얻어진 XDP에 차등적 또는 고양된 세포 향성을 부여하며, 이의 예는 다음과 같이 생산 및 평가되었다는 것을 나타낸다. 실시예 13 및 15의 XDP 생산 및 편집 방법을 이용하여, 각각의 XDP 형질감염은 분자량에서 다양한 각 당단백질(들) 플라스미드의 0.262pM 및 스페이서 12.7을 사용하여 tdTomato 유전자좌를 표적화하는 3.3μg(0.467pM)의 psPax2 플라스미드, 19.8μg(3.24pM)의 pStx43.119 플라스미드, 5μg(3.13pM)의 pStx42 플라스미드(가이드 174를 가짐)를 사용하였다. 당단백질 플라스미드는 동일한 백본 pGP2를 함유하였고 그들이 발현하는 상이한 바이러스 외피 단백질을 발현함에 의해서만 변화하였다. 다음 플라스미드를 형질감염에 사용하였다: 광견병은 0.94μg의 pGP29를 사용하였고; FUG E는 0.95μg의 pGP60을 사용하였고; HSV-1은 0.28μg의 pGP14.1, 0.22μg의 pGP14.2, 0.27μg의 pGP14.3 및 0.20μg의 pGP14.4를 사용하였고; RD114는 0.96μg의 pGP8을 사용하였고; HCV는 0.97ug의 pGP23을 사용하였고; EBOV는 1.02μg의 pGP41을 사용하였고; Mokola는 1.02μg의 pGP30을 사용하였다. 규범적인 HSV-1 위형화는 이 검정에서 등몰량으로 사용된 4개의 당단백질을 필요로 한다(Polpitiya Arachchige, S., Henke, W., Kalamvoki, M. 등 Analysis of herpes simplex type 1 gB, gD, and gH/gL on production of infectious HIV-1: HSV-1 gD restricts HIV-1 by exclusion of HIV-1 Env from maturing viral particles. Retrovirology 16:9 (2019)). 당단백질 아미노산 서열은 야생형 바이러스 서열에서 유래한다. 핵산 서열은 또한 야생형 바이러스 서열에서 유래했지만 일부는 인간 세포주에서 합성 및 발현을 위해 최적화된 코돈이었다.
마우스 tdTomato NPC에서 편집 효율은 상기에서 기술된 바와 같이 생성된, VSV-G, 광견병, FUG E, HSV-1, RD114, C형 간염 바이러스(HCV) 및 에볼라 바이러스(EBOV)로부터의 당단백질을 갖는 위형화된 XDP의 초기 패널로 시험되었다. 결과를 도 27에 나타내었다. FUG E, Mokola 및 단순 포진 바이러스-1(HSV-1) 합체된 당단백질을 갖는 작제물은 NPC에서 어느 정도의 세포 진입을 달성할 것으로 예상된 반면, 광견병은 마우스 신경 전구 세포 안으로 세포 진입에 대한 판독인, 검정의 조건 하에서 편집의 관찰가능한 수준을 초래하는 VSV-G 이외의 유일한 당단백질이었다. 반대로, HCV, EBOV 및 RD114로 위형화된 XDP는 마우스 NPC에서 임의의 편집을 달성하지 못했으며, 이는 이 세포 유형에 대한 잠재적인 세포 특이성 요구사항을 나타낸다.
본 발명자들은 또한 상이한 바이러스 당단백질을 사용한 위형화가 전반적인 크기 분포에 영향을 미칠 수 있는지 여부를 평가하였고, 이는 관심있는 상이한 조직에서 생체내 편집 효율에 영향을 미칠 수 있다. 이 실험을 위해, 광견병 위형화된 XDP 10X 및 VSV-G 위형화된 XDP 1x는 6웰 형식으로 확장되고 pGP2 플라스미드 대신 pGP29를 사용하여 상기에 기술된 프로토콜을 사용하여 생성되었다. 사용된 모든 플라스미드 양과 세포는 8-배 축소되었다. VSV-G 위형화된 XDP 1X는 상기에 기술된 바와 같이 생성되었다. 그런 다음 이들 제제는 수크로스 완충액 없이 4℃에서 90분 동안 20,000 x g에서 농축되었다. LV는 다음 플라스미드 중량으로 형질감염되었다: 5.4μg의 psPax2, 1.8μg의 pGP2 및 7.2μg의 pStx34.119.174.12.7, VSV-G 위형화된 XDP 1X와 동일한 효소적 능력을 갖는 RNP의 생산 및 합체를 유도하도록 설계된 렌티바이러스 생성. 샘플은 분석을 위해 적절하게 희석되었다. 입자의 크기와 수는 Tunable Resistive Pulse Sensor(Izon Biosciences qNano Gold)를 사용하여 평가되었다. 광견병 및 VSV-G XDP 둘 모두는 75-140nm 크기의 범위에 있는 반면, 렌티바이러스(LV)는 도 28a에 도시된 바와 같이 85-160nm의 크기인 범위로 약간 더 큰 경향이 있다. 도 28b는 광견병 위형화된 XDP가 VSV-G 위형화된 XDP와 비교하여 더 작은 모드로 향한 경향이 있음을 나타낸다.
[표 19]. 당단백질에 대한 플라스미드 인코딩 서열.
실시예 18: 고양된 편집 능력을 갖는 CasX를 포함하는 RNP를 갖는 XDP의 구축 및 평가
XDP 플랫폼 내의 표적화 능력 및 특이성을 개선하는 것에 부가하여, CasX 438 및 CasX 457(CasX 119와 비교)을 갖는 개선된 RNP 변이체를 합체하는 XDP의 편집 능력을 동시적으로 개선하는 능력이 조사되었다(가이드 174 및 스페이서 12.7을 가짐). RNP 변이체는 pStx43 플라스미드 내에서 CasX 인코딩 서열을 교환하여 구성되었다. RNP 457은 19.8μg의 pStx43.119를 사용하여 형질감염되었고, RNP 438은 19.8μg의 pStx43.438을 사용하여 형질감염되었고, RNP 119는 19.8μg의 pStx43.119를 사용하여 형질감염되었다(표 20에서의 서열). 마우스 NPC에서 편집 백분율은 상기에 기술된 tdTomato 검정을 사용하여 평가되었고 판독은 Attune NxT 유세포분석기를 사용하여 수행되었다. 역가는 Takara p24 급속 역가 키트를 사용하여 평가되었다. 도 29에 도시된 결과는 CasX 119를 포함하는 RNP와 비교하여 CasX 438 및 CasX 457을 포함하는 RNP를 갖는 XDP에 의한 tdTomato NPC의 고양된 편집을 입증한다.
실시예 19: 비-필수 렌티바이러스 성분이 제거된 XDP의 구축 및 평가
바이러스 벡터 안으로 RNP 패키징을 최적화함에 의해 XDP 편집을 개선하는 능력은 Gag-CasX 작제물로부터 바이러스 게놈(Gag-Pol)과 같은 비-필수 성분을 제거함에 의해 평가되었다. 더욱이, 이들 성분의 제거는 인간에서의 사용에 대한 우려의 원인이 되어온 역전사효소(RT), 인테그라제(IN) 성분을 제거하여 이들 플랫폼이 갖는 일부 안전 문제를 완화할 수 있다. 더욱이, 패키징된 모든 Gag 분자는 그것에 부착된 CasX 분자를 가지므로 XDP 분자 내로 RNP 복합체의 증가된 패키징의 가능성을 제공한다.
XDP는 상기에 기술된 것과 동일한 접근법을 사용하여 생성되었다(즉, 8 x 106 LentiX 세포를 10cm 접시에 도말하고, 24시간 후에 세포를 DNA로 형질감염시키고, 형질감염 16시간 후에 배지를 교체하고, XDP를 형질감염-후 72시간에 수집하고 농축했다). 여기서, 본 발명자들은 Gag-CasX-PR(또는 pMRG103; 표 20에서의 서열)이라고 하는 Gag, CasX 및 프로테아제 성분을 갖는 새로운 플라스미드를 도입했다. 이 플라스미드는 SQNYPIVQ(서열번호: 20) HIV-1 절단 부위에 의해 연결된 CasX 분자가 이어지는 gag 폴리단백질을 함유한다. CasX 분자 다음에는 HA 태그 및 HIV-1로부터 Pol 단백질의 성분에 연결된 또 다른 SQNYPIVQ(서열번호: 20) HIV-1 절단 부위가 이어진다. 이 성분은 HIV-1 프로테아제(PR)를 함유하고 HIV-1 역전사효소(RT), p15 및 인테그라제(INT) 성분을 결한다. 세포막에서 XDP가 발아되면, 프로테아제는 천연 Gag-Pol 복합체에서 발견되는 프로테아제와 동일하게 기능한다; 이것은 SQNYPIVQ(서열번호: 20) HIV-1 절단 부위를 이량체화하고 그의 절단을 촉진하여 Gag 및 PR로부터 CasX를 유리한다. 이 새로운 작제물을 갖는 XDP를 생성하기 위해, 다음 플라스미드 양이 사용되었다: pGP2 0.3μg, 스페이서 12.7을 갖는 pStx42(가이드 174) 5μg, 및 pStx43.119(CasX 119) 19.8μg. 추가 작제물은 다음 플라스미드 양을 사용하였다; 100% Gag-Pol은 3.3μg의 psPax2를 사용하였고; 50% Gag-Pol + 50% Gag-CasX 작제물은 1.65μg의 psPax2 및 1.48μg의 Gag-CasX-PR을 사용하였고; 30% Gag-Pol + 70% Gag-CasX 작제물은 0.99μg의 psPax2 및 1.47μg의 Gag-CasX-PR을 사용하였고; 15% Gag-Pol + 85% Gag-CasX 작제물은 0.50μg의 psPax2 및 2.51μg의 Gag-CasX-PR을 사용하였고; 100% Gag-CasX 작제물은 3.00μg의 Gag-CasX-PR을 사용하였다. 서열은 표 20에 제공되어 있다.
tdTomato NPC의 편집은 상기 기재된 바와 같이 평가되었고, XDP 제제의 역가는 Takara p24 급속 역가 키트를 사용하여 평가되었다. 도 30에 도시된 결과는 Gag-CasX-PR로 생성되고 Gag-Pol을 포함하지 않은 XDP는 100% Gag-Pol을 갖는 XDP가 있는 ~108 입자와 비교하여 ~106 입자에서 동일한 양의 편집을 달성할 수 있었음을 입증했다. 다른 작제물은 입자의 역가에 비례한 편집을 보였다. 생성된 다양한 작제물에 대한 역가 데이터는 도 31에 도시되어 있다. 본 발명자들은 도 32에 묘사된 바와 같이 상이한 XDP 작제물에 대한 가이드 RNA 정량화에 의해 나타난 바와 같이, 편집 효율에서 관찰된 이 향상이 XDP당 RNP 분자의 고양된 패키징에 기인한다고 믿는다.
[표 20]: 플라스미드 인코딩 서열
실시예 20: 인간 세포를 표적화하는 XDP의 구축 및 평가
tdTomato 마우스 신경 전구 세포 모델은 XDP의 효능을 평가하기 위한 강력한 도구이다. 그러나, XDP의 의도된 임상적 적용을 고려할 때 이들 입자의 효능은 쉽게 접근가능하고 정량화가능하고 치료적으로 관련된 세포주를 사용하여 인간 세포에서 평가되어야 한다. MHC I 베타 2 마이크로글로불린(B2M)에 대한 인간 HLA 유전자좌가 이들 기준에 적합하기 때문에, XDP는 상기 실시예 13 및 15에 기술된 방법론을 사용하여 생성되었으며, RNP는 Jurkat 세포인, 인간 T-세포주에서 평가하기 위해 B2M을 표적화하는 스페이서 서열을 갖는 CasX 119 및 gNA 174를 포함한다. 스페이서 7.9(GTGTAGTACAGAGATAGAA, 서열번호: 824) 및 7.37(GGCCGAGATGTCTCGCTCCG, 서열번호: 826)은 인간 B2M 유전자좌를 표적화하고 마우스에서 인공 tdTomato 유전자좌를 표적화하는 스페이서 12.7(CTGCATTCTAGTTGTGGTTT, 서열번호: 825)은 비-표적화 스페이서로 사용되었다. Jurkat 세포는 10% FBS, 피루브산나트륨 및 GlutaMAX가 보충된 RPMI 배지에서 96웰 플레이트에 접종되었다. Opti-MEM에 재현탁된 XDP를 Jurkat 세포에 넣기 전에 RPMI 배지에서 하프-로그 연속 희석액으로 희석하고 1000 x g에서 15분 동안 스핀 감염했다. 세포를 분석하기 전에 37℃에서 120시간 동안 인큐베이션하였다. HLA를 염색하기 위해 본 발명자들은 DAPI를 사용하여 죽은 세포를 표시하고 PE-Cy7 마우스 항-인간 HLA-ABC 염색 키트(BD Pharmingen)를 사용하여 주요 조직적합성 복합체, 클래스 I을 염색했다. 세포 표면에서 이 복합체의 발현은 B2M 녹아웃에 의해 차단되었다.
결과:
도 33에 도시된 결과는 스페이서 7.9, 스페이서 7.37, 또는 비-표적화 스페이서를 갖는 CasX 분자를 함유하는 XDP로 처리된 후 Jurkat 세포에서 상대적인 HLA 음성(편집된) 모집단을 묘사한다. 결과는 실험 조건 하에서 스페이서 7.9를 갖는 XDP가 Jurkat 세포의 ~10%에서 B2M을 녹아웃할 수 있음을 나타낸다.
실시예 21: 다양한 구성에서 HIV-1 Gag의 대안적 구조를 갖는 HIV-1 XDP의 생성 및 효능 평가.
이들 실험의 목적은 시험관내 또는 생체내 전달에 의해; 진핵 세포의 편집에서의 그 유용성을 입증하기 위해 RNP로서 CasX 및 가이드 RNA를 포함하는 XDP 작제물의 다양한 구성을 만드는 것이었다. RNP 전달을 위해 특별히 설계된 가장 효율적이고 최소의 HIV-1 캡시드를 생성하기 위해, 본 발명자들은 tdTomato에 가이드 RNA 174 및 스페이서 12.7과 CasX 491을 갖는 35가지 다른 버전의 HIV-1 기반 XDP를 만들어 1) HIV의 성분이 표적 핵산을 편집할 수 있는 세포에 RNP의 성공적인 전달을 위해 필요한지 필요하지 않은지를 판단하고; 2) XDP의 다중 구성이 RNP를 세포에 성공적으로 전달하고 표적 핵산을 편집할 수 있음을 입증한다. 방법
XDP의 생성을 위한 방법
버전 1, 4, 5, 7-27, 32-40, 및 122-124, 126 및 128(도 36-68 참조)로 지칭되는 XDP의 대안적인 구성 버전은 tdTomato(CTGCATTCTAGTTTGGTTT에 의해 인코딩됨, 서열번호: 825)에 표적화된 스페이서 서열 12.7을 갖는 단일 가이드 RNA 변이체와 복합된 CasX 491의 RNP를 함유하도록 설계되었다. 아래 섹션에 기술된 방법을 사용하여, XDP 버전은 gag-pol HIV-1 시스템의 성분을 인코딩하는 하나 이상의 구조적 플라스미드, 위형화 당단백질을 인코딩하는 플라스미드 및 단일 가이드 RNA를 인코딩하는 플라스미드(각 버전, 이용된 플라스미드 및 플라스미드가 인코딩하는 성분의 개략도에 대해서는 도 36-68 참조))로 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. 버전 번호별로 그룹화된 표 21은 표에 표시된 성분 및 도면의 상응하는 버전을 함유하는 XDP의 각 버전을 생성하는 데 사용된 플라스미드 및 그 서열을 나열한다. 가이드 RNA를 인코딩하는 플라스미드의 경우, pStx42 플라스미드는 단일-가이드 형식(p42.174.12.7)에서 tdTomato에 표적화된 스캐폴드 및 스페이서 성분을 갖는 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. 또 다른 pStx42 플라스미드를 이용하여 스캐폴드 및 비-표적화 스페이서 성분(Stx42.174.NT)를 갖는 가이드 RNA 카세트를 만들고, 편집 검정에서 대조군으로 사용했다. XDP를 위형화하기 위한 VSV-G(pGP2)를 인코딩하는 플라스미드도 사용되었다(표 22). 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다.
구조적 플라스미드 클로닝
pXDP3, pXDP17, pXDP23-32, pXDP98-100, pXDP102 및 pXDP103을 생성하기 위해, pXDP1(UC Berkeley)을 EcoRI를 사용하여 단리하여 gag-pol 서열을 제거하였다. 제조업체의 프로토콜에 따라 15-20개 염기쌍 중첩을 갖는 In Fusion 프라이머와 Kapa HiFi DNA 폴리머라제를 사용하여 CasX 및 HIV-1 성분을 함유하는 단편 1 내지 3개를 증폭했다. 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제했다. 이들 단편은 제조업체의 프로토콜에 따라 Takara로부터의 In-Fusion HD Cloning Kit(Cat# 639650)를 사용하여 플라스미드 백본 안으로 클로닝되었다. 어셈블리된 생성물은 암피실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다. 인코딩 서열은 표 23에 제시되어 있다. 표의 첫 번째 열은 버전 번호와 포함된 CasX 분자를 기술한다. 두 번째는 HIV 성분과 CasX 분자의 구성이다. 이들 디자인 플라스미드에 대한 플라스미드 번호는 세 번째 열에 있다. 네 번째 열은 해당되는 경우 HIV-1 gag, HIV-1 pol 및 CasX 분자에 대한 단지 인코딩 서열에 대한 SEQ IDS를 함유한다.
가이드 플라스미드 클로닝
가이드 RNA 174 및 비-표적화 스페이서를 인코딩하는 p42.174.NT(NT 서열 CGAGACGTAATTACGTCTCG, 서열번호: 827) 플라스미드 및 tdTomato를 표적화하는 p42.174.12.7을 표준 클로닝 방법을 사용하여 클로닝하였다. 포유동물 발현 백본은 cPPT, 암피실린 내성 및 colEI 복제 부위를 함유했고 U6 프로모터 및 가이드 RNA 스캐폴드 카세트를 수용하기 위해 적절한 중첩을 갖는 프라이머를 사용하여 증폭되었다. 이들 단편은 In-Fusion 클로닝에 적합한 프라이머 및 제조업체의 프로토콜에 따라 Kapa HiFi DNA 폴리머라제를 사용하여 증폭되었다. 단편은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 이들 단편은 제조업체 프로토콜에 따라 Takara로부터의 In-Fusion® HD Cloning Kit(Cat# 639650)를 사용하여 플라스미드 백본 안으로 클로닝되었다. 어셈블리된 생성물은 암피실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
p42.174.NT 안으로 tdTomato 스페이서 12.7 클로닝
tdTomato 표적화 스페이서 12.7에 대한 표적화 스페이서 서열 DNA는 표적화 서열(CTGCATTCTAGTTGTGGTTT, 서열번호 825) 및 이 서열의 역상보체로 구성된 단일-가닥 DNA(ssDNA) 올리고(Integrated DNA Technologies)로 주문되었다. 이들 두 올리고는 함께 어닐링되고 p42.174 NT 또는 대안적인 스캐폴드를 갖는 p42 플라스미드 안으로 클로닝되었다. 이것은 T4 DNA 리가제(New England BioLabs Cat# M0202L) 및 NEB로부터 Esp3I 제한 효소(New England BioLabs Cat# R0734L)를 사용하여 골든 게이트 어셈블리에 의해 수행되었다. 골든 게이트 생성물은 카르베니실린을 함유하는 LB-아가 플레이트(LB: Teknova Cat# L9315, 아가: Quartzy Cat# 214510) 상에 도말된, 화학적으로 적격인 Turbo 컴피턴트 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 결찰을 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
pGP2 당단백질 플라스미드 클로닝
VSV-G 당단백질 및 CMV 프로모터를 인코딩하는 서열은 In-Fusion 클로닝에 적합한 프라이머 및 제조업체의 프로토콜에 따라 Kapa HiFi DNA 폴리머라제를 사용하여 pMD2.G(UC Berkeley)로부터 증폭되었다. 백본은 카나마이신 내성 플라스미드로부터 취해지고 동일한 방법을 사용하여 증폭되었다. 이들은 제조업체의 프로토콜에 따라 Zymoclean Gel DNA Recovery Kit를 사용하여 1% 아가로스 겔로부터 겔 추출에 의하여 정제되었다. 이들 단편은 제조업체 프로토콜에 따라 Takara로부터 In-Fusion® HD Cloning Kit(Cat 639650)를 사용하여 플라스미드 백본 안으로 클로닝되었다. 어셈블리된 생성물은 카나마이신을 함유하는 LB-아가 플레이트 상에 도말된, 화학적으로-적격인 Turbo Competent 대장균 박테리아 세포 안으로 형질전환되고 37℃에서 인큐베이션되었다. 개별 콜로니가 제조업체의 프로토콜에 따라 Qiagen 스핀 미니프렙 키트를 사용하여 선택되고 미니프렙되었다. 생성된 플라스미드는 올바른 어셈블리를 보장하기 위해 Sanger 시퀀싱을 사용하여 서열분석되었다.
세포 배양 및 형질감염
HEK293T Lenti-X 세포를 HEPES 및 글루타맥스(Thermo Fisher)를 갖는 10% FBS 보충 DMEM에서 유지하였다. 세포를 15cm 접시에 20mL의 배지에서 접시당 20 x 106 세포로 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해, 표 21의 XDP 구조적 플라스미드(또한 CasX 변이체를 인코딩함)를 13 내지 80.0μg 범위의 양으로 사용하였다. 각 형질감염은 또한 13μg의 p42.174.12.7과 0.25μg의 pGP2를 수용했다. 그런 다음 폴리에틸렌이민(PEI Max, Polyplus)을 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 플레이트로부터 흡인하고 Opti-MEM(Thermo Fisher)으로 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 0.45μM 필터를 통해 여과했다. 상등액을 농축하고 NTE(50mM Tris-HCL, 100mM NaCl, 10% 수크로스, pH 7.4) 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 10,000 x g에서 원심분리를 통해 정제했다. XDP는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 300μL의 DMEM/F12에 재현탁되었다.
재현탁 및 형질도입
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM/F12에서 성장되었다. 세포를 StemPro Accutase Cell Dissociation Reagent를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 성장되도록 한 후 순수 재현탁된 바이러스로 시작하여 5 하프-로그 희석액을 통해 진행하는 표적화 XDP(tdTomato에 대한 스페이서를 가짐)에 대해 처리했다. 그런 다음 세포를 1000g에서 15분 동안 원심분리하였다. NPC는 tdTomato의 편집 마커로서 형광을 분석하기 전에 96시간 동안 성장되었다. 검정은 유사한 결과로 각 샘플에 대해 2-3회 실행되었다. 단일 검정에 대한 편집 결과는 표 21에 나타나 있다.
결과
편집 결과는 검정의 조건 하에서 35개의 대안적인 구성의 대부분이 적어도 10% 또는 초과의 편집으로 NPC를 편집할 수 있었고 7개 버전은 >80% 편집을 나타내는 것으로 확인되었다. 부가적으로, Gag의 HIV 구조적 성분 중 일부는 필요하지 않은 것으로 확인되었으며, 편집은 매트릭스(MA) 성분만 CasX에 연결되는 일 구성에서 관찰되었다. 숙주 세포로부터 발아를 촉진하는 p1/p6 성분은 모든 버전에서 높은 편집의 수준(>= 70%, V1, V7, V8, V33, V34, V40, V123, V124)과 연관되어 있어 이 성분이 효능에 중요하다는 것을 시사한다. 버전 34, 40 및 123과 같이 NC가 없는 입자는 높은 편집의 수준을 달성할 수 있었던 반면, CA가 없는 입자(예컨대 버전 17)는 낮은 편집의 수준(37%)을 가졌다. 결과는 또한 버전 7, 8, 40, 123 및 124에 의해 입증된 바와 같이 XDP가 높은 수준의 편집 효능을 유지하는 데 프로테아제 성분이 필요하지 않다는 것을 입증했다. 더욱이, NC의 성분인 p2는 또한 122(MA-CA-p1/p6)가 p2를 갖지 않고 44.4% 편집을 달성하고 버전 128(MA-CA-p2-p1/p6)은 p2를 포함하고 29.2% 편집만을 아카이브하는 표 XX에서 버전 122와 128을 비교할 때 나타난 바와 같이 효능에 유해하였다. 부가하여, 다중 p1/p6을 갖는 작제물은 도 35에 도시된 바와 같이 편집을 증강시키는 데 기여할 수 있으나(버전 122 대 123), 이것은 다른 구성; 예를 들어, 버전 7(MA-CA-NC-p1/p6-X) 대 버전 124(MA-CA-NC-p1/p6-p1/p6)의 경우에는 입증되지 않았으며, 여기서 버전 7은 92.2% 편집을 달성하고 버전 124는 72.3% 편집만을 달성하였다.
전반적으로, 결과는 검정의 조건 하에서 XDP의 다중 구성이 진핵 세포로 CasX 및 가이드 RNA 치료 페이로드를 전달할 수 있는 입자를 성공적으로 어셈블리할 수 있어 표적 핵산의 편집을 초래할 수 있음을 뒷받침한다.
[표 21]: 버전 구성에 의한, XDP 작제물에 의한 NPC의 편집.
*% 편집은 5개 희석의 평균 복제물의 최대 편집 백분율을 취함에 의해 계산되었다.
[표 22]: 가이드 및 당단백질에 대한 인코딩 서열
[표 23]: XDP 버젼 및 성분 인코딩 서열
실시예 22: 레트로바이러스로부터 유래된 Gag-(-1)-프로테아제-CasX 구성에서 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경되고 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변경된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 RNP의 사용은 또한 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 레트로바이러스과 패밀리의 다른 속에서 유래된 고유한 CasX 전달 입자를 만들고 동정하는 것이다. 다음 실험에서 조사된 속에는 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 비-영장류 렌티바이러스 및 스푸마레트로바이러스가 포함된다.
XDP의 생성을 위한 방법
Gag-프로테아제-CasX 변이(버전 44 및 45; 도 52a 참조)의 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래된 XDP는 각각 Gag-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP40 및 pXDP41 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에 융합된 CasX 491 단백질을 함유한다. TSCYHCGT(서열번호: 944) 절단 부위는 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 46, 47, 62 및 90; 도 52b 참조)에서 베타레트로바이러스(풍토병성 비강 종양 바이러스(ENTV), 마우스 유방 종양 바이러스(MMTV) 및 메이슨-화이자 원숭이 바이러스(MPMV))에서 유래된 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. DCLDFDND(서열번호: 934), DLVLLSAE(서열번호: 935), PQVMAAVA(서열번호: 936) 및 PQVMAAVA(서열번호: 936) 절단 부위는 각각 pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 48, 49 및 63)에서 델타레트로바이러스(소 백혈병 바이러스(BLV) 및 인간 T 림프성 바이러스(HTLV1))로부터 유래된 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP45, pXDP46, 및 pXDP62 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. PAILPIIS(서열번호: 945), PQVLPVMH(서열번호: 946) 및 PQVLPVMH(서열번호: 946) 절단 부위는 각각 pXDP45, pXDP46 및 pXDP62 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 50)에서 엡실론레트로바이러스(월아이 진피 육종 바이러스(WDSV))로부터 유래된 XDP는 각각 Gag-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP47 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. ARQMTAHT(서열번호 937) 절단 부위는 pXDP47 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 51 및 52)에서 감마레트로바이러스(고양이 백혈병 바이러스(FLV) 및 뮤어라인 백혈병 바이러스(MMLV))로부터 유래된 XDP는 도 54a에 묘사되고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP48 및 pXDP49 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SSLYPVLP(서열번호: 938) 및 SSLYPALT(서열번호: 939) 절단 부위는 각각 pXDP48 및 pXDP49 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버젼 53, 54, 55 및 91)에서 비-영장류 렌티바이러스(염소 관절염 뇌염(CAEV), 말 감염성 빈혈 바이러스(EIAV), 원숭이 면역결핍 바이러스(SIV) 및 비스나 마에디 바이러스(VMV))로부터 유래된 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적인 형질감염에 의해 생성되었다. pXDP50, pXDP51, pXDP52, pXDP53 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. AGGRSWKA(서열번호: 940), SEEYPIMI(서열번호: 941), GGNYPVQQ(서열번호: 942) 및 REVYPIVN(서열번호: 943) 절단 부위는 각각 pXDP50, pXDP51, pXDP52, pXDP53 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 56, 57, 58, 59, 60, 61 및 92)에서 스푸마레트로바이러스아과 패밀리(소 거품 바이러스(BFV), 말 거품 바이러스(EFV), 고양이 거품 바이러스(FFV), 갈색 대 갈라고 원원류 거품 바이러스(BGPFV), 레소스 마카크 원숭이 거품 바이러스(RHSFV) 및 원숭이 거품 바이러스(SFV)) 유래 XDP는 각각 Gag-(-1)-프로테아제-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 24에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SAVHSVRL(서열번호: 784), RTVNTVRV(서열번호: 785), NTVHTVRQVES(서열번호: 786), AAVHTVKA(서열번호: 787), RTVNTVTT(서열번호: 788) 및 RSVNTVTA(서열번호: 789) 절단 부위는 각각 pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 24에 제시되어 있다.
[표 24]: XDP 버전에 대한 플라스미드 인코딩 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지 내 접시당 8e6 세포로 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양이 구조적 플라스미드에 개별적으로 사용되었다: pXDP40(151μg), pXDP41(151μg), pXDP42(157μg), pXDP43(157μg), pXDP44(159μg), pXDP45(145μg), pXDP46(149μg), pXDP47(152μg), pXDP48(148μg), pXDP49(149μg), pXDP50(145μg), pXDP51(146μg), pXDP52(147μg), pXDP53(144μg), pXDP54(149μg), pXDP55(153μg), pXDP56(154μg), pXDP57(150μg), pXDP58(146μg), pXDP59(154μg), pXDP60(154μg), pXDP61(159μg), pXDP62(149μg), pXDP63(147μg), pXDP88(146μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에서 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2가 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장하였다. pXDP88로 만든 버전 29 XDP는 다양한 레트로바이러스의 Gag-Pro-Stx 버전을 테스트하는 이들 실험을 위한 HIV 렌티바이러스 대조군이다.
결과: 편집 검정의 결과는 하기 도 69a 및 b, 도 70 및 표 25 및 표 26에 나타나 있다. 도 69a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 도 70은 16.6μl의 농축된 XDP prep이 tdTomato NPC를 처리하는 데 사용될 때 다양한 XDP 버전의 편집 효능을 구체적으로 나타낸다. 표 25 및 26은 50μl 및 16.6μl의 농축된 XDP prep이 NPC를 처리하는 데 사용될 때 dtTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 여러 다른 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 25]: 1차 희석액(50μl)에 대한 편집 검정의 결과
[표 26]: 2차 희석액(16.6μl)에 대한 편집 검정의 결과
실시예 23: 레트로바이러스로부터 유래된 MA-CA-CasX 구성에서 XDP 작제물의 형질감염 및 회수
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경 및 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변형된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 이들 바이러스 벡터 내에 패키징된 RNP의 사용은 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 이전 실시예를 기반으로 하고 서로 다른 아키텍처를 사용하여 레트로바이러스과 패밀리의 서로 다른 속에서 유래된 고유한 CasX 전달 입자를 만들고 동정하는 것이었다. 다음 실험에서 조사된 속은 MA-CA-CasX 구성의 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 비-영장류 렌티바이러스를 포함하며, 이에 의해 NC 및 프로테아제 도메인을 제거한다.
방법
XDP의 생성을 위한 방법
MA-CA-CasX 변이(버전 66a 및 67a; 도 55b 참조)에서 알파레트로바이러스(ALV 및 RSV)로부터 유래된 XDP는 각각 MA-CA-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP64 및 pXDP65 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 491 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 68A, 69A, 70A 및 87A, 도 56b)에서 베타레트로바이러스(ENTV, MMTV 및 MPMV)로부터 유래된 XDP는 각각 MA-CA-CasX, 당단백질 및 가이드 RNA를 인코딩하고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP66, pXDP67, pXDP68 및 pXDP85 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 71A, 72A 및 88A, 도 57b)에서 델타레트로바이러스(BLV 및 HTLV1)로부터 유래된 XDP는 도 57b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP69, pXDP70 및 pXDP86 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 73A, 도 58b)에서 엡실론레트로바이러스(WDSV)로부터 유래된 XDP는 도 58b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP71 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 74A 및 75A, 도 59b)에서 감마레트로바이러스(FLV 및 MMLV)로부터 유래된 XDP는 도 59b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP72 및 pXDP73 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
MA-CA-CasX 변이(버전 76A, 77A, 78A, 79A 및 89A, 도 60b)에서 비-영장류 렌티바이러스(CAEV, EIAV, SIV 및 VMV)로부터 유래된 XDP는 도 60b에 묘사되고 표 27에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP74, pXDP75, pXDP76, pXDP77 및 pXDP87 플라스미드는 매트릭스 서열에 이어 캡시드 서열 및 C-말단에서 융합된 CasX 단백질을 함유한다. 캡시드와 뉴클레오캡시드 단백질 사이의 절단 부위는 각 바이러스에 대해 그대로 유지되었고 각각의 바이러스 프로테아제를 함유하는 플라스미드와 커플링될 때 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 CasX 단백질 서열 바로 앞에 선행한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 27에 제시되어 있다.
[표 27]: XDP 버전에 대한 플라스미드 인코딩 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양을 구조적 플라스미드에 개별적으로 사용했다: pXDP64(143μg), pXDP65(143μg), pXDP66(142μg), pXDP67(143μg), pXDP68(144μg), pXDP69(136μg), pXDP70(137μg), pXDP71(141μg), pXDP72(140μg), pXDP73(142μg), pXDP74(134μg), pXDP75(134μg), pXDP76(134μg), pXDP85(144μg), pXDP86(137μg), pXDP87(138μg), pXDP32(114μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지 내 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP32를 갖는 버전 18은 이들 실험에 대한 대조군으로 역할을 한다.
결과: 편집 검정의 결과는 하기 도 71a 및 b, 도 72 및 표 28 및 29에 도시되어 있다. 도 73a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 도 72는 16.6μl의 농축된 XDP prep을 사용하여 tdTomato NPC를 처리할 때 다양한 XDP 버전의 편집 효능을 구체적으로 나타낸다. 표 28 및 29는 50μl 및 16.6μl의 농축된 XDP prep을 사용하여 NPC를 처리할 때 dtTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 MA-CA-X 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 28]: 제1 희석액(50ul)에 대한 편집 검정의 결과
[표 29]: 제2 희석액(16.6μl)에 대한 편집 검정의 결과
실시예 24: 레트로바이러스로부터 유래된 Gag-(-1)-프로테아제-CasX 구성에서 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경되고 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변경된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 RNP의 사용은 또한 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 레트로바이러스과 패밀리의 다른 속으로부터 유래된 고유한 CasX 전달 입자를 생성하고 동정하는 것이다. 다음 실험에서 조사된 속은 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 비-영장류 렌티바이러스 및 스푸마레트로바이러스를 포함한다.
XDP의 생성을 위한 방법
Gag-프로테아제-CasX 변이(버전 44 및 45; 도 52a 참조)에서 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래된 XDP는 도 52a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP40 및 pXDP41 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 491 단백질을 함유한다. TSCYHCGT(서열번호: 944) 절단 부위는 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 46, 47, 62 및 90; 도 52b 참조)에서 베타레트로바이러스(동물성 비강 종양 바이러스(ENTV), 마우스 유방 종양 바이러스(MMTV) 및 메이슨-화이자 원숭이 바이러스(MPMV))로부터 유래된 XDP는 도 52b에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. DCLDFDND(서열번호: 934), DLVLLSAE(서열번호: 935), PQVMAAVA(서열번호: 936) 및 PQVMAAVA(서열번호: 936) 절단 부위는 각각 pXDP42, pXDP43, pXDP44 및 pXDP61 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 48, 49 및 63; 도 53a 참조)에서 델타레트로바이러스(소 백혈병 바이러스(BLV) 및 인간 T 림프성 바이러스(HTLV1))로부터 유래된 XDP는 도 53a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP45, pXDP46 및 pXDP62 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. PAILPIIS(서열번호: 945), PQVLPVMH(서열번호: 946) 및 PQVLPVMH(서열번호: 946) 절단 부위는 각각 pXDP45, pXDP46 및 pXDP62 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 50; 도 53b 참조)에서 엡실론레트로바이러스(월아이 피부 육종 바이러스(WDSV))로부터 유래된 XDP는 도 53b에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP47 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. ARQMTAHT(서열번호: 937) 절단 부위는 pXDP47 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-프로테아제-CasX 변이(버전 51 및 52; 도 54a 참조)에서 감마레트로바이러스(고양이 백혈병 바이러스(FLV) 및 뮤어라인 백혈병 바이러스(MMLV))로부터 유래된 XDP는 도 54a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP48 및 pXDP49 플라스미드는 Gag 폴리단백질 서열에 이어 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SSLYPVLP(서열번호: 938) 및 SSLYPALT(서열번호: 939) 절단 부위는 각각 pXDP48 및 pXDP49 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 53, 54, 55 및 91; 도 54b 참조)에서 비-영장류 렌티바이러스(염소 관절염 뇌염(CAEV), 말 감염성 빈혈 바이러스(EIAV), 원숭이 면역결핍 바이러스(SIV) 및 비스나 마에디 바이러스(VMV))로부터 유래된 XDP는 도 54b에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP50, pXDP51, pXDP52, pXDP53 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. AGGRSWKA(서열번호: 940), SEEYPIMI(서열번호: 941), GGNYPVQQ(서열번호: 942) 및 REVYPIVN(서열번호: 943) 절단 부위는 각각 pXDP50, pXDP51, pXDP52, pXDP53 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
Gag-(-1)-프로테아제-CasX 변이(버전 56, 57, 58, 59, 60, 61 및 92; 도 55a 참조)에서 스푸마레트로바이러스아과 패밀리(소 거품 바이러스(BFV), 말 거품 바이러스(EFV), 고양이 거품 바이러스(FFV), 갈색 대 갈라고 원원류 거품 바이러스(BGPFV), 레소스 마카크 원숭이 거품 바이러스(RHSFV) 및 원숭이 거품 바이러스(SFV)) 유래 XDP는 도 55a에 묘사되고 표 30에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드는 Gag 폴리단백질 서열에 이어 리보솜 프레임시프트, 프로테아제 및 C-말단에서 융합된 CasX 단백질을 함유한다. SAVHSVRL(서열번호: 784), RTVNTVRV(서열번호: 785), NTVHTVRQVES(서열번호: 786), AAVHTVKA(서열번호: 787), RTVNTVTT(서열번호: 788) 및 RSVNTVTA(서열번호: 789) 절단 부위는 각각 pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60 플라스미드에서 XDP 성숙 동안 편집 분자의 분리를 매개하기 위해 프로테아제 단백질과 CasX 단백질 서열을 분리했다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 30에 제시되어 있다.
[표 30]: 플라스미드 및 XDP 인코딩 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 도시되어 있다. HEK293T Lenti-X® 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포로 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양이 구조적 플라스미드에 개별적으로 사용되었다: pXDP40(151μg), pXDP41(151μg), pXDP42(157μg), pXDP43(157μg), pXDP44(159μg), pXDP45(145μg) , pXDP46(149μg), pXDP47(152μg), pXDP48(148μg), pXDP49(149μg), pXDP50(145μg), pXDP51(146μg), pXDP52(147μg), pXDP53(144μg), pXDP54(149μg), pXDP55(153μg), pXDP56(154μg), pXDP57(150μg), pXDP58(146μg), pXDP59(154μg), pXDP60(154μg), pXDP61(159μg), pXDP62(149μg), pXDP63(147μg), pXDP88(146μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP88로 만든 버전 29 XDP는 다양한 레트로바이러스의 Gag-Pro-Stx 버전을 시험하는 이들 실험에 대한 HIV 렌티바이러스 대조군이다.
결과: 편집 검정의 결과는 하기 도 69a 및 b와 표 31 및 표 32에 나타나 있다. 도 69a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 표 31 및 32는 50μl 및 16.6μl의 농축된 XDP prep이 사용되어 NPC를 처리할 때 dtTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 여러 다른 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 31]: 1차 희석액(50μl)에 대한 편집 검정의 결과
[표 32]: 2차 희석액(16.6μl)에 대한 편집 검정의 결과
실시예 25: 레트로바이러스로부터 유래된 Gag-CasX 구성에서 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경 및 증강될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변형된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 이들 바이러스 벡터 내에 패키징된 RNP의 사용은 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 이전 실시예를 기반으로 하고 서로 다른 아키텍처를 사용하여 레트로바이러스과 패밀리의 서로 다른 속에서 유래된 고유한 CasX 전달 입자를 생성하고 동정하는 것이다. 다음 실험에서 조사된 속은 Gag-CasX 구성의 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스 및 비-영장류 렌티바이러스를 포함한다. 실험은 HIV 렌티바이러스 기반 V7 작제물과 직접적인 비교인 것으로 의미되었으며, Gag 성분은 XDP가 Gag로부터 요구된 활성 방출을 편집할 수 있는지 여부를 시험하기 위해 모든 작제물에서 제거된 프로테아제 도메인을 갖는, 알파레트로바이러스, 베타레트로바이러스, 감마레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 비-영장류 렌티바이러스 및 스푸마레트로바이러스의 상응하는 Gag 성분으로 대체되었다.
XDP의 생성을 위한 방법
Gag-CasX 변이(V102 및 V114; 도 62b 참조)에서 알파레트로바이러스(조류 백혈병 바이러스(ALV) 및 라우스 육종 바이러스(RSV))로부터 유래된 XDP는 도 62b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. pXDP127 및 pXDP139 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V106, V111, V112 및 V113, 도 64a)에서 베타레트로바이러스(풍토병성 비강 종양 바이러스(ENTV), 마우스 유방 종양 바이러스(MMTV) 및 메이슨-화이자 원숭이 바이러스(MPMV))로부터 유래된 XDP는 도 64a에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP131, pXDP136, pXDP137 및 pXDP138 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(버전 V103, V108 및 V109, 도 63a)에서 델타레트로바이러스(소 백혈병 바이러스(BLV) 및 인간 T 림프성 바이러스(HTLV1))로부터 유래된 XDP는 도 63a에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP128, pXDP133 및 pXDP134 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(버전 73A, 도 58b)에서 엡실론레트로바이러스(월아이 피부 육종 바이러스(WDSV))로부터 유래된 XDP는 도 58b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP127 및 pXDP139 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V107 및 V110, 도 64b)에서 감마레트로바이러스(고양이 백혈병 바이러스(FLV) 및 뮤어라인 백혈병 바이러스(MMLV))로부터 유래된 XDP는 도 64b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP132 및 pXDP135 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V104, V105, V115, V116 및 V117, 도 63b)에서 비-영장류 렌티바이러스(염소 관절염 뇌염(CAEV), 말 감염성 빈혈 바이러스(EIAV), 원숭이 면역결핍 바이러스(SIV) 및 비스나 마에디 바이러스(VMV))로부터 유래된 XDP는 도 63b에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP129, pXDP130, pXDP140, pXDP141 및 pXDP142 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 491 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
Gag-CasX 변이(V80a, V81a, V82a, V83a, V84a, V85a 및 V86a; 도 62a 참조)에서 스푸마레트로바이러스아과 패밀리(소 거품 바이러스(BFV), 말 거품 바이러스(EFV), 고양이 거품 바이러스(FFV), 갈색 대 갈라고 원원류 거품 바이러스(BGPFV), 레소스 마카크 원숭이 거품 바이러스(RHSFV) 및 원숭이 거품 바이러스(SFV)) 유래 XDP는 도 62a에 묘사되고 표 33에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포의 일시적 형질감염에 의해 생성되었다. pXDP78, pXDP79, pXDP80, pXDP81, pXDP82, pXDP83 및 pXDP84 플라스미드는 Gag 폴리단백질 서열에 이어 C-말단에서 융합된 CasX 단백질을 함유한다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨)을 갖는 CasX 가이드 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 작제물에 통합되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 33에 제시되어 있다.
[표 33]: XDP 플라스미드 및 인코딩 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 도시되어 있다. HEK293T Lenti-X 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포에서 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양을 구조적 플라스미드에 개별적으로 사용했다: pXDP127(146μg), pXDP129(141μg), pXDP130(143μg), pXDP131(145μg), pXDP132(143μg), pXDP135(145μg), pXDP136(152μg), pXDP138(149μg), pXDP139(146μg), pXDP140(143μg), pXDP141(143μg), pXDP142(141μg), pXDP143(146μg), pXDP78(145μg), pXDP81(141μg), pXDP82(139μg), pXDP83(145μg), pXDP0017(122μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에서 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 48시간 동안 37℃에서 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato에 대해 스페이서 12.7을 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP32를 갖는 버전 18은 이들 실험에 대한 대조군으로 역할을 한다.
결과: 편집 검정의 결과는 하기 도 75a 및 b, 도 76 그리고 표 34 및 표 35에 도시되어 있다. 도 75a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 표 34 및 35는 50ul 및 16.6ul의 농축된 XDP prep을 사용하여 NPC를 처리할 때 tdTomato 표적 서열의 편집 %를 나타내는 결과를 나타낸다. 결과는 검정의 조건 하에서 XDP의 Gag-CasX 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 4% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 34]: 1차 희석액(50ul)에 대한 편집 검정의 결과
[표 35]: 2차 희석액(16.6ul)에 대한 편집 검정의 결과
실시예 26: 스푸마레트로바이러스아과로부터 유래된 XDP 작제물의 형질감염 및 회수.
편집 효율성 및 특이성은 이용되는 CasX 전달의 방법으로 변경 및 증진될 수 있다. 레트로바이러스 기원의 것들을 포함한 다양한 바이러스 벡터 패밀리가 CasX RNP의 일시적 전달을 위해 조작될 수 있다. 변형된 세포 및 조직 향성으로 편집을 잠재적으로 증강시키는 것 외에도 이들 바이러스 벡터 내에 패키징된 RNP의 사용은 삽입 돌연변이유발 및 장기 이식유전자 발현의 잠재적 위험을 무효화하는 고유한 이점을 제공한다. 다음 실험의 목적은 이전 실시예를 기반으로 하고 서로 다른 아키텍처를 사용하여 레트로바이러스과 패밀리의 서로 다른 속으로부터 유래된 고유한 CasX 전달 입자를 만들고 동정하는 것이었다. 다음 실험에서 조사된 속은 Gag-CasX + Gag-(-1)-프로테아제-CasX 구성에서의 스푸마레트로바이러스를 포함한다. 여기에서 본 발명자들은 Gag-CasX 폴리단백질과 함께 Gag-프로테아제-CasX 폴리단백질을 갖는 다른 양의 프로테아제를 추가함에 의해 단백질분해 절단에 의해 매개되는 XDP 입자 형성 및 성숙을 잠재적으로 개선할 수 있었음을 가정했다.
방법
XDP의 생성을 위한 방법
90% Gag-CasX + 10% Gag-(-1)-프로테아제-CasX 변이(V80b, V81b, V82b, V83b, V84b, V85b 및 V86b; 도 62a 참조)에서 스푸마레트로바이러스아과 패밀리(BFV, EFV, FFV, BGPFV, RHSFV 및 SFV)로부터 유래된 XDP는 도 62a에 묘사되고 표 36에 나열된 3개의 플라스미드를 사용하여 LentiX HEK293T 세포(Takara Biosciences)의 일시적 형질감염에 의해 생성되었다. 플라스미드 pXDP54, pXDP55, pXDP56, pXDP57, pXDP58, pXDP59 및 pXDP60은 이전 실시예에서 기술되었다. pStx42.174.12.7 플라스미드는 단일-가이드 형식에서 스캐폴드 174 및 스페이서 성분(tdTomato에 표적화됨: CTGCATTCTAGTTTGTGTTT, 서열번호: 825)을 갖는 CasX 가이드 RNA 카세트의 인간 U6 프로모터 업스트림으로 생성되었다. XDP를 위형화하기 위해 VSV-G를 함유하는 플라스미드(pGP2)도 사용되었다. 모든 플라스미드에는 암피실린 또는 카나마이신 내성 유전자가 함유되어 있다. 플라스미드 안으로 합체된 서열은 표 36 및 A에 제시되어 있다.
[표 36]: 플라스미드 서열
형질감염
XDP의 생성을 위한 단계는 도 24에 그래픽으로 묘사되어 있다. HEK293T Lenti-X 세포를 HEPES, 페니실린/스트렙토마이신(Pen/Step), 피루브산나트륨 및 2-머캅토에탄올을 갖는 10% FBS 보충 DMEM에서 유지했다. 세포를 10mL의 배지에서 접시당 8e6 세포에서 2개 15cm 접시에 접종했다. 세포를 형질감염 전 24시간 동안 정착시키고 성장시켰다. 형질감염 당시 세포는 70-90% 융합되었다. 형질감염을 위해 다음 플라스미드 양이 구조적 플라스미드에 개별적으로 사용되었다: pXDP78 + pXDP54(146μg + 15μg), pXDP81 + pXDP57(150μg + 15μg), pXDP82 + pXDP58(146μg + 15μg), pXDP83 + pXDP59(154μg + 15.4μg). 구조적 플라스미드와 함께, 각 형질감염은 또한 3800μl의 Opti-MEM 배지에서 26.3μg의 pStx42.174.12.7 및 5μg의 pGP2를 수용했다. 그런 다음 1mg/ml 선형 폴리에틸렌이민(PEI, MW=25,000 Da)을 1:3 DNA:PEI 농도로 플라스미드 혼합물에 첨가하고, 혼합하고, 세포 배양물에 첨가하기 전에 실온에서 인큐베이션하도록 하였다.
수집 및 농축
배지를 형질감염-후 24시간에 세포에서 교체하였다. XDP-함유 배지를 형질감염-후 72시간에 수집하고 60mL 주사기를 사용하여 0.45μM 필터를 통해 여과했다. 여과된 상등액을 NTE 내 10% 수크로스 완충액을 사용하여 4℃에서 4시간 동안 17,000 x g에서 원심분리하여 농축했다. 농축된 XDP는 사용할 때까지 -20℃에서 유지하였다.
XDP를 사용한 tdTomato 신경 전구 세포의 편집
tdTomato 신경 전구 세포(tdT NPC)는 글루타맥스, HEPES, 비-필수 아미노산, Pen/Strep, 2-머캅토에탄올, 비타민 A 없는 B-27 및 N2로 보충된 DMEM F12에서 성장되었다. 세포를 Takara Biosciences Neuron Dissociation Kit를 사용하여 수확하고 PLF 코팅된 96웰 플레이트 상에 접종했다. 세포를 37℃에서 48시간 동안 성장시킨 후 하프-로그 희석액을 사용하여 수크로스 완충액 농축액으로부터 10x 농축액으로 표적화 XDP(tdTomato용 스페이서를 가짐)로 처리했다. NPC는 tdTomato의 편집 마커로서 형광의 분석 전에 96시간 동안 성장시켰다. pXDP32를 갖는 버전 18은 이들 실험에 대한 대조군으로 역할을 한다.
결과: 편집 검정의 결과는 하기 도 73a 및 b, 도 74 그리고 표 37 및 표 38에 도시되어 있다. 도 73a 및 b는 tdTomato NPC에서 다양한 XDP 버전의 특정 양에 대한 백분율 편집 효능을 나타낸다. 도 74는 16.6μl의 농축된 XDP prep이 tdTomato NPC를 처리하는 데 사용될 때 다양한 XDP 버전의 편집 효능을 구체적으로 나타낸다. 표 37과 38은 50μl 및 16.6μl의 농축된 XDP prep을 NPC를 처리하는 데 사용했을 때 dtTomato 표적 서열의 % 편집을 보여주는 결과를 나타낸다. 결과는 검정의 조건 하에서, XDP의 90% Gag-CasX + 10% Gag-프로테아제-CasX 구성에서 레트로바이러스과의 구성원을 사용하여 구성된 XDP가 속의 대부분에 대해, 10% 이상의 여러 편집으로, NPC 세포에서 표적 핵산의 상당한 편집을 초래할 수 있음을 나타낸다.
[표 37]: 1차 희석액(50ul)에 대한 편집 검정의 결과
[표 38]: 2차 희석액(16.6ul)에 대한 편집 검정의 결과
SEQUENCE LISTING
<110> Scribe Therapeutics Inc.
<120> PARTICLE DELIVERY SYSTEMS
<130> SCRB-024/05WO 333322-2107
<150> US 63/120,864
<151> 2020-12-03
<150> US 63/035,576
<151> 2020-06-05
<150> US 62/983,460
<151> 2002-02-28
<150> US 62/968,915
<151> 2020-01-31
<150> US 62/944,982
<151> 2019-12-06
<160> 1010
<170> PatentIn version 3.5
<210> 1
<211> 986
<212> PRT
<213> Unknown
<220>
<223> Deltaproteobacteria sp.
<400> 1
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val
20 25 30
Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys
35 40 45
Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn
50 55 60
Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu
65 70 75 80
Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys
85 90 95
Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys
100 105 110
Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys
115 120 125
Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser
130 135 140
Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala
145 150 155 160
Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp
165 170 175
Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg
325 330 335
Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys
340 345 350
Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val
355 360 365
Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro
370 375 380
Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys
385 390 395 400
Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys
405 410 415
Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg
420 425 430
Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu
435 440 445
Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp
450 455 460
Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp
465 470 475 480
Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly
485 490 495
Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val
500 505 510
Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr
515 520 525
Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe
530 535 540
Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp
545 550 555 560
Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly
565 570 575
Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu
580 585 590
Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu
595 600 605
Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu
610 615 620
Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly
625 630 635 640
Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu
645 650 655
Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp
660 665 670
Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly
675 680 685
Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile
690 695 700
Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala
705 710 715 720
Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe
725 730 735
Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala
740 745 750
Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe
755 760 765
Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met
770 775 780
Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu
785 790 795 800
Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala
805 810 815
Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Thr
820 825 830
Ala Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser Asp Gly
835 840 845
Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly Gln Ile
850 855 860
Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu Ser
865 870 875 880
Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile Ser
885 890 895
Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys Lys
900 905 910
Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp Cys
915 920 925
Gly His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg
930 935 940
Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys
945 950 955 960
Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg
965 970 975
Arg Leu Lys Glu Val Trp Lys Pro Asn Ala
980 985
<210> 2
<211> 978
<212> PRT
<213> Unknown
<220>
<223> Planctomycetes sp.
<400> 2
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 3
<211> 855
<212> PRT
<213> Unknown
<220>
<223> Candidatus sungbacteria sp.
<400> 3
Met Asp Asn Ala Asn Lys Pro Ser Thr Lys Ser Leu Val Asn Thr Thr
1 5 10 15
Arg Ile Ser Asp His Phe Gly Val Thr Pro Gly Gln Val Thr Arg Val
20 25 30
Phe Ser Phe Gly Ile Ile Pro Thr Lys Arg Gln Tyr Ala Ile Ile Glu
35 40 45
Arg Trp Phe Ala Ala Val Glu Ala Ala Arg Glu Arg Leu Tyr Gly Met
50 55 60
Leu Tyr Ala His Phe Gln Glu Asn Pro Pro Ala Tyr Leu Lys Glu Lys
65 70 75 80
Phe Ser Tyr Glu Thr Phe Phe Lys Gly Arg Pro Val Leu Asn Gly Leu
85 90 95
Arg Asp Ile Asp Pro Thr Ile Met Thr Ser Ala Val Phe Thr Ala Leu
100 105 110
Arg His Lys Ala Glu Gly Ala Met Ala Ala Phe His Thr Asn His Arg
115 120 125
Arg Leu Phe Glu Glu Ala Arg Lys Lys Met Arg Glu Tyr Ala Glu Cys
130 135 140
Leu Lys Ala Asn Glu Ala Leu Leu Arg Gly Ala Ala Asp Ile Asp Trp
145 150 155 160
Asp Lys Ile Val Asn Ala Leu Arg Thr Arg Leu Asn Thr Cys Leu Ala
165 170 175
Pro Glu Tyr Asp Ala Val Ile Ala Asp Phe Gly Ala Leu Cys Ala Phe
180 185 190
Arg Ala Leu Ile Ala Glu Thr Asn Ala Leu Lys Gly Ala Tyr Asn His
195 200 205
Ala Leu Asn Gln Met Leu Pro Ala Leu Val Lys Val Asp Glu Pro Glu
210 215 220
Glu Ala Glu Glu Ser Pro Arg Leu Arg Phe Phe Asn Gly Arg Ile Asn
225 230 235 240
Asp Leu Pro Lys Phe Pro Val Ala Glu Arg Glu Thr Pro Pro Asp Thr
245 250 255
Glu Thr Ile Ile Arg Gln Leu Glu Asp Met Ala Arg Val Ile Pro Asp
260 265 270
Thr Ala Glu Ile Leu Gly Tyr Ile His Arg Ile Arg His Lys Ala Ala
275 280 285
Arg Arg Lys Pro Gly Ser Ala Val Pro Leu Pro Gln Arg Val Ala Leu
290 295 300
Tyr Cys Ala Ile Arg Met Glu Arg Asn Pro Glu Glu Asp Pro Ser Thr
305 310 315 320
Val Ala Gly His Phe Leu Gly Glu Ile Asp Arg Val Cys Glu Lys Arg
325 330 335
Arg Gln Gly Leu Val Arg Thr Pro Phe Asp Ser Gln Ile Arg Ala Arg
340 345 350
Tyr Met Asp Ile Ile Ser Phe Arg Ala Thr Leu Ala His Pro Asp Arg
355 360 365
Trp Thr Glu Ile Gln Phe Leu Arg Ser Asn Ala Ala Ser Arg Arg Val
370 375 380
Arg Ala Glu Thr Ile Ser Ala Pro Phe Glu Gly Phe Ser Trp Thr Ser
385 390 395 400
Asn Arg Thr Asn Pro Ala Pro Gln Tyr Gly Met Ala Leu Ala Lys Asp
405 410 415
Ala Asn Ala Pro Ala Asp Ala Pro Glu Leu Cys Ile Cys Leu Ser Pro
420 425 430
Ser Ser Ala Ala Phe Ser Val Arg Glu Lys Gly Gly Asp Leu Ile Tyr
435 440 445
Met Arg Pro Thr Gly Gly Arg Arg Gly Lys Asp Asn Pro Gly Lys Glu
450 455 460
Ile Thr Trp Val Pro Gly Ser Phe Asp Glu Tyr Pro Ala Ser Gly Val
465 470 475 480
Ala Leu Lys Leu Arg Leu Tyr Phe Gly Arg Ser Gln Ala Arg Arg Met
485 490 495
Leu Thr Asn Lys Thr Trp Gly Leu Leu Ser Asp Asn Pro Arg Val Phe
500 505 510
Ala Ala Asn Ala Glu Leu Val Gly Lys Lys Arg Asn Pro Gln Asp Arg
515 520 525
Trp Lys Leu Phe Phe His Met Val Ile Ser Gly Pro Pro Pro Val Glu
530 535 540
Tyr Leu Asp Phe Ser Ser Asp Val Arg Ser Arg Ala Arg Thr Val Ile
545 550 555 560
Gly Ile Asn Arg Gly Glu Val Asn Pro Leu Ala Tyr Ala Val Val Ser
565 570 575
Val Glu Asp Gly Gln Val Leu Glu Glu Gly Leu Leu Gly Lys Lys Glu
580 585 590
Tyr Ile Asp Gln Leu Ile Glu Thr Arg Arg Arg Ile Ser Glu Tyr Gln
595 600 605
Ser Arg Glu Gln Thr Pro Pro Arg Asp Leu Arg Gln Arg Val Arg His
610 615 620
Leu Gln Asp Thr Val Leu Gly Ser Ala Arg Ala Lys Ile His Ser Leu
625 630 635 640
Ile Ala Phe Trp Lys Gly Ile Leu Ala Ile Glu Arg Leu Asp Asp Gln
645 650 655
Phe His Gly Arg Glu Gln Lys Ile Ile Pro Lys Lys Thr Tyr Leu Ala
660 665 670
Asn Lys Thr Gly Phe Met Asn Ala Leu Ser Phe Ser Gly Ala Val Arg
675 680 685
Val Asp Lys Lys Gly Asn Pro Trp Gly Gly Met Ile Glu Ile Tyr Pro
690 695 700
Gly Gly Ile Ser Arg Thr Cys Thr Gln Cys Gly Thr Val Trp Leu Ala
705 710 715 720
Arg Arg Pro Lys Asn Pro Gly His Arg Asp Ala Met Val Val Ile Pro
725 730 735
Asp Ile Val Asp Asp Ala Ala Ala Thr Gly Phe Asp Asn Val Asp Cys
740 745 750
Asp Ala Gly Thr Val Asp Tyr Gly Glu Leu Phe Thr Leu Ser Arg Glu
755 760 765
Trp Val Arg Leu Thr Pro Arg Tyr Ser Arg Val Met Arg Gly Thr Leu
770 775 780
Gly Asp Leu Glu Arg Ala Ile Arg Gln Gly Asp Asp Arg Lys Ser Arg
785 790 795 800
Gln Met Leu Glu Leu Ala Leu Glu Pro Gln Pro Gln Trp Gly Gln Phe
805 810 815
Phe Cys His Arg Cys Gly Phe Asn Gly Gln Ser Asp Val Leu Ala Ala
820 825 830
Thr Asn Leu Ala Arg Arg Ala Ile Ser Leu Ile Arg Arg Leu Pro Asp
835 840 845
Thr Asp Thr Pro Pro Thr Pro
850 855
<210> 4
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 4
acaucuggcg cguuuauucc auuacuuugg agccaguccc agcgacuaug ucguauggac 60
gaagcgcuua uuuaucggag agaaaccgau aaguaaaacg caucaaag 108
<210> 5
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 5
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 6
<211> 81
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 6
acaucuggcg cguuuauucc auuacuuugg agccaguccc agcgacuaug ucguauggac 60
gaagcgcuua uuuaucggag a 81
<210> 7
<211> 78
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 7
acaucuggcg cguuuauucc auuacuuugg agccaguccc agcgacuaug ucguauggac 60
gaagcgcuua uuuaucgg 78
<210> 8
<211> 80
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 8
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga 80
<210> 9
<211> 77
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 9
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucgg 77
<210> 10
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 10
guuuacacac ucccucucau agggu 25
<210> 11
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 11
guuuacacac ucccucucau gaggu 25
<210> 12
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 12
uuuuacauac ccccucucau gggau 25
<210> 13
<211> 25
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 13
guuuacacac ucccucucau ggggg 25
<210> 14
<211> 20
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 14
ccagcgacua ugucguaugg 20
<210> 15
<211> 39
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 15
gcgcuuauuu aucggagaga aauccgauaa auaagaagc 39
<210> 16
<211> 74
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 16
ggcgcuuuua ucucauuacu uugagagcca ucaccagcga cuaugucgua uggguaaagc 60
gcuuauuuau cgga 74
<210> 17
<211> 7
<212> PRT
<213> Unknown
<220>
<223> TEV protease cleavage site
<220>
<221> MISC_FEATURE
<222> (2)..(3)
<223> Xaa is any amino acid
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa is any amino acid
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa is Gly or Ser
<400> 17
Glu Xaa Xaa Tyr Xaa Gln Xaa
1 5
<210> 18
<211> 7
<212> PRT
<213> Unknown
<220>
<223> TEV protease cleavage site
<400> 18
Glu Asn Leu Tyr Phe Gln Gly
1 5
<210> 19
<211> 7
<212> PRT
<213> Unknown
<220>
<223> TEV protease cleavage site
<400> 19
Glu Asn Leu Tyr Phe Gln Ser
1 5
<210> 20
<211> 8
<212> PRT
<213> Unknown
<220>
<223> HIV-1 cleavage site
<400> 20
Ser Gln Asn Tyr Pro Ile Val Gln
1 5
<210> 21
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 21
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys
100 105 110
Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe
115 120 125
Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln
130 135 140
Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu
165 170 175
Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His
195 200 205
Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser
225 230 235 240
Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile
245 250 255
Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala
260 265 270
Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu
305 310 315 320
Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 22
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 22
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Thr Ala Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser
820 825 830
Asp Gly Trp Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu
850 855 860
Leu Ser Ala Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp
865 870 875 880
Ile Ser Lys Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu
900 905 910
Asp Cys Gly His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 23
<211> 985
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 23
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val
20 25 30
Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys
35 40 45
Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn
50 55 60
Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu
65 70 75 80
Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys
85 90 95
Lys Phe Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile
100 105 110
Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys
115 120 125
Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn
130 135 140
Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser
145 150 155 160
Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn
165 170 175
Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu
180 185 190
Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys
195 200 205
Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly
210 215 220
Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser
225 230 235 240
Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn
245 250 255
Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu
260 265 270
Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly
275 280 285
Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn
290 295 300
Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro
305 310 315 320
Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg Arg
325 330 335
Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys Leu
340 345 350
Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val Thr
355 360 365
Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro Asn
370 375 380
Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys Lys
385 390 395 400
Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys Lys
405 410 415
Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg Ile
420 425 430
Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu Ala
435 440 445
Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp Leu
450 455 460
Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp Glu
465 470 475 480
Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly Asp
485 490 495
Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val Asp
500 505 510
Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr Arg
515 520 525
Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe Tyr
530 535 540
Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp Gly
545 550 555 560
Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly Gly
565 570 575
Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu Gln
580 585 590
Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu Phe
595 600 605
Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu Ala
610 615 620
Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly Arg
625 630 635 640
Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val
645 650 655
Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp Arg
660 665 670
Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys
675 680 685
Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile Leu
690 695 700
Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala Ala
705 710 715 720
Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe Ala
725 730 735
Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala Arg
740 745 750
Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe Glu
755 760 765
Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Thr
770 775 780
Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu Ala
785 790 795 800
Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln
805 810 815
Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Thr Ala
820 825 830
Asp Tyr Asp Gly Met Leu Val Arg Leu Lys Lys Thr Ser Asp Gly Trp
835 840 845
Ala Thr Thr Leu Asn Asn Lys Glu Leu Lys Ala Glu Gly Gln Ile Thr
850 855 860
Tyr Tyr Asn Arg Tyr Lys Arg Gln Thr Val Glu Lys Glu Leu Ser Ala
865 870 875 880
Glu Leu Asp Arg Leu Ser Glu Glu Ser Gly Asn Asn Asp Ile Ser Lys
885 890 895
Trp Thr Lys Gly Arg Arg Asp Glu Ala Leu Phe Leu Leu Lys Lys Arg
900 905 910
Phe Ser His Arg Pro Val Gln Glu Gln Phe Val Cys Leu Asp Cys Gly
915 920 925
His Glu Val His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser
930 935 940
Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys Ser
945 950 955 960
Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg Arg
965 970 975
Leu Lys Glu Val Trp Lys Pro Asn Ala
980 985
<210> 24
<211> 986
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 24
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val
20 25 30
Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys
35 40 45
Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Asn Ala Ala Asn Asn
50 55 60
Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala Ile Leu
65 70 75 80
Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu Met Cys
85 90 95
Lys Phe Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys
100 105 110
Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys
115 120 125
Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser
130 135 140
Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala
145 150 155 160
Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp
165 170 175
Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu Arg
325 330 335
Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys Lys
340 345 350
Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly Val
355 360 365
Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu Pro
370 375 380
Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro Lys
385 390 395 400
Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu Lys
405 410 415
Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu Arg
420 425 430
Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu Glu
435 440 445
Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp Trp
450 455 460
Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met Asp
465 470 475 480
Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr Gly
485 490 495
Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Arg Val Val
500 505 510
Asp Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr
515 520 525
Arg Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe
530 535 540
Tyr Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp
545 550 555 560
Gly Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly
565 570 575
Gly Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu
580 585 590
Gln Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu
595 600 605
Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu
610 615 620
Ala Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly
625 630 635 640
Arg Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu
645 650 655
Val Val Asp Pro Ser Asn Ile Lys Pro Val Asn Leu Ile Gly Val Asp
660 665 670
Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly
675 680 685
Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro Thr Asp Ile
690 695 700
Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala Ile Gln Ala
705 710 715 720
Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Phe
725 730 735
Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg Asn Ser Ala
740 745 750
Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val Leu Val Phe
755 760 765
Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met
770 775 780
Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr Ala Lys Leu
785 790 795 800
Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala
805 810 815
Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser
820 825 830
Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly
835 840 845
Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile
850 855 860
Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser
865 870 875 880
Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser
885 890 895
Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys
900 905 910
Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys
915 920 925
Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg
930 935 940
Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser Tyr Lys
945 950 955 960
Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr Lys Arg
965 970 975
Arg Leu Lys Glu Val Trp Lys Pro Asn Ala
980 985
<210> 25
<211> 921
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 25
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Val Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro
675 680 685
Thr Asp Ile Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Phe Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Ser Ala Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val
740 745 750
Leu Val Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala
915 920
<210> 26
<211> 920
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 26
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala
915 920
<210> 27
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 27
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Asn Ala Ala
50 55 60
Asn Asn Leu Arg Met Leu Leu Asp Asp Tyr Thr Lys Met Lys Glu Ala
65 70 75 80
Ile Leu Gln Val Tyr Trp Gln Glu Phe Lys Asp Asp His Val Gly Leu
85 90 95
Met Cys Lys Phe Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 28
<211> 986
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 28
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu
325 330 335
Arg Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys
340 345 350
Lys Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly
355 360 365
Val Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu
370 375 380
Pro Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro
385 390 395 400
Lys Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu
405 410 415
Lys Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu
420 425 430
Arg Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu
435 440 445
Glu Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp
450 455 460
Trp Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met
465 470 475 480
Asp Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr
485 490 495
Gly Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Ser Ile
500 505 510
Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile Trp
515 520 525
Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn Tyr
530 535 540
Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala Phe
545 550 555 560
Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu Ile
565 570 575
Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile Ile
580 585 590
Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp Asn
595 600 605
Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly Arg
610 615 620
Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu Pro
625 630 635 640
Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp Ser
645 650 655
Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn
660 665 670
Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser
675 680 685
Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly
690 695 700
Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu Val
705 710 715 720
Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala
725 730 735
Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu
740 745 750
Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser
755 760 765
Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln
770 775 780
Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly
785 790 795 800
Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys
805 810 815
Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg
820 825 830
Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile
835 840 845
Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg
850 855 860
Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg
865 870 875 880
Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly
885 890 895
Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg
900 905 910
Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His
915 920 925
Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu
930 935 940
Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn
945 950 955 960
Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys
965 970 975
Lys Leu Lys Glu Val Trp Lys Pro Ala Val
980 985
<210> 29
<211> 925
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 29
Met Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu Leu Thr Asp
1 5 10 15
Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp Glu Glu Phe
20 25 30
Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln Pro Ala Pro
35 40 45
Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp Gly Asn Glu
50 55 60
Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu
65 70 75 80
Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys Pro His Thr
85 90 95
Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg Leu Ile Leu
100 105 110
Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser
115 120 125
Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser Ile His Val
130 135 140
Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu Gln Ile Gly Gly
145 150 155 160
Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu Ser Asp Ala Cys
165 170 175
Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu
180 185 190
Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu
195 200 205
Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu
210 215 220
Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val
225 230 235 240
Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu Trp Gln Lys Leu
245 250 255
Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe
260 265 270
Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp
275 280 285
Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp
290 295 300
Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala
305 310 315 320
Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys
325 330 335
Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His Leu Glu Lys Lys
340 345 350
His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile
355 360 365
Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu
370 375 380
Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu
385 390 395 400
Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys
405 410 415
Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp
420 425 430
Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Arg Val Val Asp
435 440 445
Ile Ser Gly Phe Ser Ile Gly Ser Asp Gly His Ser Ile Gln Tyr Arg
450 455 460
Asn Leu Leu Ala Trp Lys Tyr Leu Glu Asn Gly Lys Arg Glu Phe Tyr
465 470 475 480
Leu Leu Met Asn Tyr Gly Lys Lys Gly Arg Ile Arg Phe Thr Asp Gly
485 490 495
Thr Asp Ile Lys Lys Ser Gly Lys Trp Gln Gly Leu Leu Tyr Gly Gly
500 505 510
Gly Lys Ala Lys Val Ile Asp Leu Thr Phe Asp Pro Asp Asp Glu Gln
515 520 525
Leu Ile Ile Leu Pro Leu Ala Phe Gly Thr Arg Gln Gly Arg Glu Phe
530 535 540
Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Leu Ile Lys Leu Ala
545 550 555 560
Asn Gly Arg Val Ile Glu Lys Thr Ile Tyr Asn Lys Lys Ile Gly Arg
565 570 575
Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val
580 585 590
Val Asp Pro Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg
595 600 605
Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys
610 615 620
Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu
625 630 635 640
Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys
645 650 655
Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala
660 665 670
Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg
675 680 685
Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu
690 695 700
Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala
705 710 715 720
Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala
725 730 735
Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr
740 745 750
Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp
755 760 765
Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met
770 775 780
Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr
785 790 795 800
Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu
805 810 815
Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp
820 825 830
Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe
835 840 845
Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe
850 855 860
Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp
865 870 875 880
Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr
885 890 895
Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe
900 905 910
Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
915 920 925
<210> 30
<211> 975
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 30
Met Glu Lys Arg Ile Asn Lys Ile Arg Lys Lys Leu Ser Ala Asp Asn
1 5 10 15
Ala Thr Lys Pro Val Ser Arg Ser Gly Pro Met Lys Thr Leu Leu Val
20 25 30
Arg Val Met Thr Asp Asp Leu Lys Lys Arg Leu Glu Lys Arg Arg Lys
35 40 45
Lys Pro Glu Val Met Pro Gln Val Ile Ser Asn Thr Ser Arg Ala Asn
50 55 60
Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu
65 70 75 80
His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser
85 90 95
Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile
100 105 110
Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys
115 120 125
Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn
130 135 140
Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser
145 150 155 160
Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn
165 170 175
Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu
180 185 190
Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys
195 200 205
Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly
210 215 220
Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr
225 230 235 240
Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn
245 250 255
Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu
260 265 270
Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly
275 280 285
Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn
290 295 300
Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro
305 310 315 320
Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln
325 330 335
Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu
340 345 350
Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala
355 360 365
Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu
370 375 380
Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu
385 390 395 400
Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr
405 410 415
Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys
420 425 430
His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys
435 440 445
Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu
450 455 460
Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys
465 470 475 480
Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu
485 490 495
Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn
500 505 510
Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr
515 520 525
Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile
530 535 540
Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys
545 550 555 560
Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp
565 570 575
Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg
580 585 590
Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys
595 600 605
Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr
610 615 620
Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg
625 630 635 640
Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile
645 650 655
Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu
660 665 670
Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His
675 680 685
Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln
690 695 700
Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys
705 710 715 720
Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr
725 730 735
Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile
740 745 750
Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe
755 760 765
Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys
770 775 780
Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala
785 790 795 800
Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser
805 810 815
Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly
820 825 830
Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile
835 840 845
Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser
850 855 860
Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser
865 870 875 880
Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys
885 890 895
Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys
900 905 910
Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg
915 920 925
Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn
930 935 940
Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln
945 950 955 960
Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 31
<211> 982
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 31
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Arg Val Val Asp Ile Ser Gly Phe Ser Ile Gly
500 505 510
Ser Asp Gly His Ser Ile Gln Tyr Arg Asn Leu Leu Ala Trp Lys Tyr
515 520 525
Leu Glu Asn Gly Lys Arg Glu Phe Tyr Leu Leu Met Asn Tyr Gly Lys
530 535 540
Lys Gly Arg Ile Arg Phe Thr Asp Gly Thr Asp Ile Lys Lys Ser Gly
545 550 555 560
Lys Trp Gln Gly Leu Leu Tyr Gly Gly Gly Lys Ala Lys Val Ile Asp
565 570 575
Leu Thr Phe Asp Pro Asp Asp Glu Gln Leu Ile Ile Leu Pro Leu Ala
580 585 590
Phe Gly Thr Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser
595 600 605
Leu Glu Thr Gly Leu Ile Lys Leu Ala Asn Gly Arg Val Ile Glu Lys
610 615 620
Thr Ile Tyr Asn Lys Lys Ile Gly Arg Asp Glu Pro Ala Leu Phe Val
625 630 635 640
Ala Leu Thr Phe Glu Arg Arg Glu Val Val Asp Pro Ser Asn Ile Lys
645 650 655
Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val
660 665 670
Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp
675 680 685
Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys
690 695 700
Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg
705 710 715 720
Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala
725 730 735
Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val
740 745 750
Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly
755 760 765
Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met
770 775 780
Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr
785 790 795 800
Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn
805 810 815
Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys
820 825 830
Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu
835 840 845
Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln
850 855 860
Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu
865 870 875 880
Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu
885 890 895
Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu
900 905 910
Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln
915 920 925
Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu
930 935 940
Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg
945 950 955 960
Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu
965 970 975
Val Trp Lys Pro Ala Val
980
<210> 32
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 32
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 33
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 33
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Ala Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala
<210> 34
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 34
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 35
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 35
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Gln Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 36
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 36
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Gln Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 37
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 37
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Ile Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Val Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 38
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 38
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Asn Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 39
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 39
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Thr Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 40
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 40
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Ser Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 41
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 41
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 42
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 42
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Lys Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 43
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 43
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 44
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 44
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 45
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 45
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Asn Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 46
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 46
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Ser Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 47
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 47
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 48
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 48
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Asp Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 49
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 49
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Phe Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 50
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 50
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Val Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 51
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 51
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Val Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 52
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 52
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 53
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 53
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Asn Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 54
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 54
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Lys Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 55
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 55
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Lys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Asn Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 56
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 56
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Met Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 57
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 57
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 58
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 58
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 59
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 59
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 60
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 60
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 61
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 61
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Val
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His
195 200 205
Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser
225 230 235 240
Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile
245 250 255
Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala
260 265 270
Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu
305 310 315 320
Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 62
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 62
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 63
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 63
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 64
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 64
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 65
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 65
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 66
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 66
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 67
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 67
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 68
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 68
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 69
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 69
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 70
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 70
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 71
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 71
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 72
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 72
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 73
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 73
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 74
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 74
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Ser Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Leu Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 75
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 75
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 76
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 76
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 77
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 77
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 78
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 78
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 79
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 79
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 80
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 80
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 81
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 81
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asn Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 82
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 82
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 83
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 83
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 84
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 84
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 85
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 85
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 86
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 86
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 87
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 87
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Asn Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 88
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 88
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Pro Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 89
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 89
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val
195 200 205
Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu
225 230 235 240
Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys
245 250 255
Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly
260 265 270
Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys
305 310 315 320
Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 90
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 90
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 91
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 91
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 92
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 92
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 93
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 93
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 94
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 94
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 95
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 95
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Met Ser Ser Gly
115 120 125
Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu
130 135 140
Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys
145 150 155 160
Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro
165 170 175
Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His
195 200 205
Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser
225 230 235 240
Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile
245 250 255
Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala
260 265 270
Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu
305 310 315 320
Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 96
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 96
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 97
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 97
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 98
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 98
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 99
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 99
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 100
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 100
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 101
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 101
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 102
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 102
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 103
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 103
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 104
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 104
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 105
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 105
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp
385 390 395 400
Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 106
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 106
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val
195 200 205
Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu
225 230 235 240
Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly
245 250 255
Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn
260 265 270
Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys
305 310 315 320
Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 107
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 107
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 108
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 108
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 109
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 109
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 110
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 110
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 111
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 111
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 112
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 112
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Leu Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Gly Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 113
<211> 986
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 113
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Val Val Glu
325 330 335
Arg Arg Glu Asn Glu Val Asp Trp Trp Asn Thr Ile Asn Glu Val Lys
340 345 350
Lys Leu Ile Asp Ala Lys Arg Asp Met Gly Arg Val Phe Trp Ser Gly
355 360 365
Val Thr Ala Glu Lys Arg Asn Thr Ile Leu Glu Gly Tyr Asn Tyr Leu
370 375 380
Pro Asn Glu Asn Asp His Lys Lys Arg Glu Gly Ser Leu Glu Asn Pro
385 390 395 400
Lys Lys Pro Ala Lys Arg Gln Phe Gly Asp Leu Leu Leu Tyr Leu Glu
405 410 415
Lys Lys Tyr Ala Gly Asp Trp Gly Lys Val Phe Asp Glu Ala Trp Glu
420 425 430
Arg Ile Asp Lys Lys Ile Ala Gly Leu Thr Ser His Ile Glu Arg Glu
435 440 445
Glu Ala Arg Asn Ala Glu Asp Ala Gln Ser Lys Ala Val Leu Thr Asp
450 455 460
Trp Leu Arg Ala Lys Ala Ser Phe Val Leu Glu Arg Leu Lys Glu Met
465 470 475 480
Asp Glu Lys Glu Phe Tyr Ala Cys Glu Ile Gln Leu Gln Lys Trp Tyr
485 490 495
Gly Asp Leu Arg Gly Asn Pro Phe Ala Val Glu Ala Glu Asn Ser Ile
500 505 510
Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile Trp
515 520 525
Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn Tyr
530 535 540
Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala Phe
545 550 555 560
Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu Ile
565 570 575
Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile Ile
580 585 590
Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp Asn
595 600 605
Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly Arg
610 615 620
Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu Pro
625 630 635 640
Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp Ser
645 650 655
Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu Asn
660 665 670
Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu Ser
675 680 685
Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile Gly
690 695 700
Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu Val
705 710 715 720
Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys Ala
725 730 735
Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu Leu
740 745 750
Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu Ser
755 760 765
Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg Gln
770 775 780
Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu Gly
785 790 795 800
Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser Lys
805 810 815
Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp Arg
820 825 830
Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr Ile
835 840 845
Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn Arg
850 855 860
Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp Arg
865 870 875 880
Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys Gly
885 890 895
Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His Arg
900 905 910
Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr His
915 920 925
Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe Leu
930 935 940
Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly Asn
945 950 955 960
Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg Lys
965 970 975
Lys Leu Lys Glu Val Trp Lys Pro Ala Val
980 985
<210> 114
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 114
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Val Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Pro Glu Phe Lys Asp Ser Ser Gly Gly Pro
675 680 685
Thr Asp Ile Leu Arg Ile Gly Glu Gly Tyr Lys Glu Lys Gln Arg Ala
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Phe Ala Ser Lys Ser Arg Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Ser Ala Arg Asp Leu Phe Tyr His Ala Val Thr His Asp Ala Val
740 745 750
Leu Val Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Thr Glu Arg Gln Tyr Thr Lys Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Thr Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 115
<211> 972
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 115
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Asn Ser Asn Ser Thr Glu Phe Lys Ser
930 935 940
Tyr Lys Ser Gly Lys Gln Pro Phe Val Gly Ala Trp Gln Ala Phe Tyr
945 950 955 960
Lys Arg Arg Leu Lys Glu Val Trp Lys Pro Asn Ala
965 970
<210> 116
<211> 84
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 116
Met Ala Ser Met Ile Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala
1 5 10 15
Ser Arg Gly Gln Ser Ala Ala Met Ala Pro Phe Gly Gly Leu Lys Ser
20 25 30
Met Thr Gly Phe Pro Val Arg Lys Val Asn Thr Asp Ile Thr Ser Ile
35 40 45
Thr Ser Asn Gly Gly Arg Val Lys Cys Met Gln Val Trp Pro Pro Ile
50 55 60
Gly Lys Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Pro Leu Thr Arg
65 70 75 80
Asp Ser Arg Ala
<210> 117
<211> 57
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 117
Met Ala Ser Met Ile Ser Ser Ser Ala Val Thr Thr Val Ser Arg Ala
1 5 10 15
Ser Arg Gly Gln Ser Ala Ala Met Ala Pro Phe Gly Gly Leu Lys Ser
20 25 30
Met Thr Gly Phe Pro Val Arg Lys Val Asn Thr Asp Ile Thr Ser Ile
35 40 45
Thr Ser Asn Gly Gly Arg Val Lys Ser
50 55
<210> 118
<211> 85
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 118
Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Val Ala Ser Pro Ala
1 5 10 15
Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala
20 25 30
Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser
35 40 45
Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Glu Lys
50 55 60
Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly
65 70 75 80
Gly Arg Val Asn Cys
85
<210> 119
<211> 76
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 119
Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Gln Asn Pro Ser Leu
1 5 10 15
Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val
20 25 30
Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser
35 40 45
Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg
50 55 60
Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys
65 70 75
<210> 120
<211> 76
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 120
Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Trp Asn Pro Ser Leu
1 5 10 15
Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val
20 25 30
Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser
35 40 45
Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg
50 55 60
Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys
65 70 75
<210> 121
<211> 72
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 121
Met Ala Gln Ile Asn Asn Met Ala Gln Gly Ile Gln Thr Leu Asn Pro
1 5 10 15
Asn Ser Asn Phe His Lys Pro Gln Val Pro Lys Ser Ser Ser Phe Leu
20 25 30
Val Phe Gly Ser Lys Lys Leu Lys Asn Ser Ala Asn Ser Met Leu Val
35 40 45
Leu Lys Lys Asp Ser Ile Phe Met Gln Leu Phe Cys Ser Phe Arg Ile
50 55 60
Ser Ala Ser Val Ala Thr Ala Cys
65 70
<210> 122
<211> 69
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 122
Met Ala Ala Leu Val Thr Ser Gln Leu Ala Thr Ser Gly Thr Val Leu
1 5 10 15
Ser Val Thr Asp Arg Phe Arg Arg Pro Gly Phe Gln Gly Leu Arg Pro
20 25 30
Arg Asn Pro Ala Asp Ala Ala Leu Gly Met Arg Thr Val Gly Ala Ser
35 40 45
Ala Ala Pro Lys Gln Ser Arg Lys Pro His Arg Phe Asp Arg Arg Cys
50 55 60
Leu Ser Met Val Val
65
<210> 123
<211> 77
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 123
Met Ala Ala Leu Thr Thr Ser Gln Leu Ala Thr Ser Ala Thr Gly Phe
1 5 10 15
Gly Ile Ala Asp Arg Ser Ala Pro Ser Ser Leu Leu Arg His Gly Phe
20 25 30
Gln Gly Leu Lys Pro Arg Ser Pro Ala Gly Gly Asp Ala Thr Ser Leu
35 40 45
Ser Val Thr Thr Ser Ala Arg Ala Thr Pro Lys Gln Gln Arg Ser Val
50 55 60
Gln Arg Gly Ser Arg Arg Phe Pro Ser Val Val Val Cys
65 70 75
<210> 124
<211> 57
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 124
Met Ala Ser Ser Val Leu Ser Ser Ala Ala Val Ala Thr Arg Ser Asn
1 5 10 15
Val Ala Gln Ala Asn Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ala
20 25 30
Ala Ser Phe Pro Val Ser Arg Lys Gln Asn Leu Asp Ile Thr Ser Ile
35 40 45
Ala Ser Asn Gly Gly Arg Val Gln Cys
50 55
<210> 125
<211> 65
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 125
Met Glu Ser Leu Ala Ala Thr Ser Val Phe Ala Pro Ser Arg Val Ala
1 5 10 15
Val Pro Ala Ala Arg Ala Leu Val Arg Ala Gly Thr Val Val Pro Thr
20 25 30
Arg Arg Thr Ser Ser Thr Ser Gly Thr Ser Gly Val Lys Cys Ser Ala
35 40 45
Ala Val Thr Pro Gln Ala Ser Pro Val Ile Ser Arg Ser Ala Ala Ala
50 55 60
Ala
65
<210> 126
<211> 72
<212> PRT
<213> Unknown
<220>
<223> chloroplast transit peptide
<400> 126
Met Gly Ala Ala Ala Thr Ser Met Gln Ser Leu Lys Phe Ser Asn Arg
1 5 10 15
Leu Val Pro Pro Ser Arg Arg Leu Ser Pro Val Pro Asn Asn Val Thr
20 25 30
Cys Asn Asn Leu Pro Lys Ser Ala Ala Pro Val Arg Thr Val Lys Cys
35 40 45
Cys Ala Ser Ser Trp Asn Ser Thr Ile Asn Gly Ala Ala Ala Thr Thr
50 55 60
Asn Gly Ala Ser Ala Ala Ser Ser
65 70
<210> 127
<211> 20
<212> PRT
<213> Unknown
<220>
<223> endosomal escape polypeptide
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa is Lys, His or Arg
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa is Lys, His or Arg
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa is Lys, His or Arg
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa is Lys, His or Arg
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa is Lys, His or Arg
<400> 127
Gly Leu Phe Xaa Ala Leu Leu Xaa Leu Leu Xaa Ser Leu Trp Xaa Leu
1 5 10 15
Leu Leu Xaa Ala
20
<210> 128
<211> 20
<212> PRT
<213> Unknown
<220>
<223> endosomal escape polypeptide
<400> 128
Gly Leu Phe His Ala Leu Leu His Leu Leu His Ser Leu Trp His Leu
1 5 10 15
Leu Leu His Ala
20
<210> 129
<211> 9
<212> PRT
<213> Unknown
<220>
<223> endosomal escape polypeptide
<400> 129
His His His His His His His His His
1 5
<210> 130
<211> 7
<212> PRT
<213> Betapolyomavirus macaca mulatta polyomavirus 1
<400> 130
Pro Lys Lys Lys Arg Lys Val
1 5
<210> 131
<211> 16
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 131
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15
<210> 132
<211> 9
<212> PRT
<213> Homo sapiens
<400> 132
Pro Ala Ala Lys Arg Val Lys Leu Asp
1 5
<210> 133
<211> 11
<212> PRT
<213> Homo sapiens
<400> 133
Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro
1 5 10
<210> 134
<211> 38
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 134
Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly
1 5 10 15
Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro
20 25 30
Arg Asn Gln Gly Gly Tyr
35
<210> 135
<211> 42
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 135
Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu
1 5 10 15
Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys
20 25 30
Asp Glu Gln Ile Leu Lys Arg Arg Asn Val
35 40
<210> 136
<211> 8
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 136
Val Ser Arg Lys Arg Pro Arg Pro
1 5
<210> 137
<211> 8
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 137
Pro Pro Lys Lys Ala Arg Glu Asp
1 5
<210> 138
<211> 8
<212> PRT
<213> Homo sapiens
<400> 138
Pro Gln Pro Lys Lys Lys Pro Leu
1 5
<210> 139
<211> 12
<212> PRT
<213> Mus musculus
<400> 139
Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro
1 5 10
<210> 140
<211> 5
<212> PRT
<213> Alphainfluenzavirus influenza A virus
<400> 140
Asp Arg Leu Arg Arg
1 5
<210> 141
<211> 7
<212> PRT
<213> Alphainfluenzavirus influenza A virus
<400> 141
Pro Lys Gln Lys Lys Arg Lys
1 5
<210> 142
<211> 10
<212> PRT
<213> Deltavirus hepatitis delta virus
<400> 142
Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu
1 5 10
<210> 143
<211> 10
<212> PRT
<213> Mus musculus
<400> 143
Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg
1 5 10
<210> 144
<211> 20
<212> PRT
<213> Homo sapiens
<400> 144
Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys
1 5 10 15
Lys Ser Lys Lys
20
<210> 145
<211> 17
<212> PRT
<213> Homo sapiens
<400> 145
Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys
1 5 10 15
Lys
<210> 146
<211> 8
<212> PRT
<213> Orthobornavirus mammalian 1 orthobornavirus
<400> 146
Pro Arg Pro Arg Lys Ile Pro Arg
1 5
<210> 147
<211> 9
<212> PRT
<213> Hepacivirus hepacivirus C
<400> 147
Pro Pro Arg Lys Lys Arg Thr Val Val
1 5
<210> 148
<211> 12
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 148
Asn Leu Ser Lys Lys Lys Lys Arg Lys Arg Glu Lys
1 5 10
<210> 149
<211> 10
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 149
Arg Arg Pro Ser Arg Pro Phe Arg Lys Pro
1 5 10
<210> 150
<211> 8
<212> PRT
<213> Lymphocryptovirus human gammaherpesvirus 4
<400> 150
Lys Arg Pro Arg Ser Pro Ser Ser
1 5
<210> 151
<211> 19
<212> PRT
<213> Alphainfluenzavirus influenza A virus
<400> 151
Lys Arg Gly Ile Asn Asp Arg Asn Phe Trp Arg Gly Glu Asn Glu Arg
1 5 10 15
Lys Thr Arg
<210> 152
<211> 11
<212> PRT
<213> Homo sapiens
<400> 152
Pro Arg Pro Pro Lys Met Ala Arg Tyr Asp Asn
1 5 10
<210> 153
<211> 8
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 153
Lys Arg Ser Phe Ser Lys Ala Phe
1 5
<210> 154
<211> 9
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 154
Lys Leu Lys Ile Lys Arg Pro Val Lys
1 5
<210> 155
<211> 19
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 155
Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Ala Ala Lys Arg Val
1 5 10 15
Lys Leu Asp
<210> 156
<211> 17
<212> PRT
<213> Deltaretrovirus human T-lymphotropic virus 1
<400> 156
Pro Lys Thr Arg Arg Arg Pro Arg Arg Ser Gln Arg Lys Arg Pro Pro
1 5 10 15
Thr
<210> 157
<211> 25
<212> PRT
<213> Caenorhabditis elegans
<400> 157
Met Ser Arg Arg Arg Lys Ala Asn Pro Thr Lys Leu Ser Glu Asn Ala
1 5 10 15
Lys Lys Leu Ala Lys Glu Val Glu Asn
20 25
<210> 158
<211> 16
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 158
Lys Thr Arg Arg Arg Pro Arg Arg Ser Gln Arg Lys Arg Pro Pro Thr
1 5 10 15
<210> 159
<211> 13
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 159
Arg Arg Lys Lys Arg Arg Pro Arg Arg Lys Lys Arg Arg
1 5 10
<210> 160
<211> 14
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 160
Pro Lys Lys Lys Ser Arg Lys Pro Lys Lys Lys Ser Arg Lys
1 5 10
<210> 161
<211> 17
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 161
His Lys Lys Lys His Pro Asp Ala Ser Val Asn Phe Ser Glu Phe Ser
1 5 10 15
Lys
<210> 162
<211> 18
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 162
Gln Arg Pro Gly Pro Tyr Asp Arg Pro Gln Arg Pro Gly Pro Tyr Asp
1 5 10 15
Arg Pro
<210> 163
<211> 16
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 163
Leu Ser Pro Ser Leu Ser Pro Leu Leu Ser Pro Ser Leu Ser Pro Leu
1 5 10 15
<210> 164
<211> 18
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 164
Arg Gly Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His
1 5 10 15
Arg Lys
<210> 165
<211> 14
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 165
Pro Lys Arg Gly Arg Gly Arg Pro Lys Arg Gly Arg Gly Arg
1 5 10
<210> 166
<211> 17
<212> PRT
<213> Unknown
<220>
<223> nuclear localization signal
<400> 166
Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Lys Lys Lys Arg Lys
1 5 10 15
Val
<210> 167
<211> 11
<212> PRT
<213> Lentivirus Human immunodeficiency virus 1
<400> 167
Tyr Gly Arg Lys Lys Arg Arg Gln Arg Arg Arg
1 5 10
<210> 168
<211> 8
<212> PRT
<213> Lentivirus Human immunodeficiency virus 1
<400> 168
Arg Lys Lys Arg Arg Gln Arg Arg
1 5
<210> 169
<211> 11
<212> PRT
<213> Lentivirus Human immunodeficiency virus 1
<400> 169
Tyr Ala Arg Ala Ala Ala Arg Gln Ala Arg Ala
1 5 10
<210> 170
<211> 11
<212> PRT
<213> Lentivirus Human immunodeficiency virus 1
<400> 170
Thr His Arg Leu Pro Arg Arg Arg Arg Arg Arg
1 5 10
<210> 171
<211> 11
<212> PRT
<213> Lentivirus Human immunodeficiency virus 1
<400> 171
Gly Gly Arg Arg Ala Arg Arg Arg Arg Arg Arg
1 5 10
<210> 172
<211> 50
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide transduction domain
<220>
<221> MISC_FEATURE
<222> (4)..(50)
<223> These individual amino acid residues may be present or absent
<400> 172
Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg
1 5 10 15
Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg
20 25 30
Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg
35 40 45
Arg Arg
50
<210> 173
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide transduction domain
<400> 173
Arg Arg Gln Arg Arg Thr Ser Lys Leu Met Lys Arg
1 5 10
<210> 174
<211> 27
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide transduction domain
<400> 174
Gly Trp Thr Leu Asn Ser Ala Gly Tyr Leu Leu Gly Lys Ile Asn Leu
1 5 10 15
Lys Ala Leu Ala Ala Leu Ala Lys Lys Ile Leu
20 25
<210> 175
<211> 33
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide transduction domain
<400> 175
Lys Ala Leu Ala Trp Glu Ala Lys Leu Ala Lys Ala Leu Ala Lys Ala
1 5 10 15
Leu Ala Lys His Leu Ala Lys Ala Leu Ala Lys Ala Leu Lys Cys Glu
20 25 30
Ala
<210> 176
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> peptide transduction domain
<400> 176
Arg Gln Ile Lys Ile Trp Phe Gln Asn Arg Arg Met Lys Trp Lys Lys
1 5 10 15
<210> 177
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 177
Gly Ser Gly Gly Ser
1 5
<210> 178
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 178
Gly Gly Ser Gly Gly Ser
1 5
<210> 179
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 179
Gly Gly Gly Ser
1
<210> 180
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 180
Gly Gly Ser Gly
1
<210> 181
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 181
Gly Gly Ser Gly Gly
1 5
<210> 182
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 182
Gly Ser Gly Ser Gly
1 5
<210> 183
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 183
Gly Ser Gly Gly Gly
1 5
<210> 184
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 184
Gly Gly Gly Ser Gly
1 5
<210> 185
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 185
Gly Ser Ser Ser Gly
1 5
<210> 186
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 186
Gly Pro Gly Pro
1
<210> 187
<211> 6
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 187
Pro Pro Ala Pro Pro Ala
1 5
<210> 188
<211> 7
<212> PRT
<213> Artificial Sequence
<220>
<223> linker polypeptide
<400> 188
Pro Pro Pro Gly Pro Pro Pro
1 5
<210> 189
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> stem loop sequence
<220>
<221> misc_feature
<222> (4)..(18)
<223> n is any ribonucleotide
<220>
<221> misc_feature
<222> (8)..(18)
<223> These individual nucleotides may be absent
<400> 189
uuunnnnnnn nnnnnnnnuu u 21
<210> 190
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> scaffold stem loop sequence
<400> 190
ccagcgacta tgtcgtatgg 20
<210> 191
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> extended stem loop sequence
<400> 191
gcgcttattt atcggagaga aatccgataa ataagaagc 39
<210> 192
<211> 465
<212> DNA
<213> Alpharetrovirus Avian Leukosis virus
<400> 192
atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60
ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120
agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180
agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240
ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300
ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360
cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420
ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctac 465
<210> 193
<211> 252
<212> DNA
<213> Alpharetrovirus Avian Leukosis virus
<400> 193
cactgcggca ccgctatcgg ctgcaactgc gccaccgcca gcgcgcctcc tcccccgtat 60
gtgggcagcg gcctctaccc ctccctggca ggagtgggag agcagcaggg ccagggcgga 120
gatacaccca gaggcgccga gcagcctaga gccgaacccg gccacgccgg ccaggcccct 180
ggccccgccc tgaccgactg ggccagaatc agagaggagc tggcctctac aggccctcca 240
gtggtcgcca tg 252
<210> 194
<211> 23
<212> RNA
<213> Unknown
<220>
<223> Deltaproteobacter sp.
<400> 194
ccgauaagua aaacgcauca aag 23
<210> 195
<211> 750
<212> DNA
<213> Alpharetrovirus Avian Leukosis virus
<400> 195
cctgtggtga tcaagaccga gggacctgcc tggacccctc tggaacctaa actgattaca 60
cggctggctg ataccgtcag aaccaagggc ctcagaagcc ccatcacaat ggccgaagtg 120
gaagccctga tgagcagccc actgctgcct cacgacgtga ccaacctgat gcgggtgatc 180
ctgggccccg ccccttacgc cctgtggatg gacgcctggg gcgtgcagct gcaaacagtt 240
atcgccgccg ccacaagaga cccccggcac ccagccaacg gccagggcag aggcgagaga 300
acaaacctgg atcggctgaa gggcctcgcc gatggcatgg ccggcaatcc tgagggccag 360
gctgctctgc tgagacccgg ggaactggtt gctatcaccg ccagcgccct gcaggccttc 420
agagaagtgg cccggctggc cgagcctaca gacccctggg ccgagatcac ccagggccct 480
tctgagagct tcgtggactt cgccaacaga ctgatcaagg ccgttgaggg ctccgacctg 540
cctcctagcg cccgcgcccc cgtgatcatc gactgtttta gacagaaatc gcaacccgac 600
atccagcagc tgatccgggc cgctccttct accctgacca cacctggcga gatcatcaag 660
tacgtgctgg acagacagaa gaccgccccc ctgaccgaca gaggaatcgc cgccgccatg 720
tctagcgcca ttcagcctct ggtgatggcc 750
<210> 196
<211> 264
<212> DNA
<213> Alpharetrovirus Avian Leukosis virus
<400> 196
gtggtcaaca gagaaagaga tggacagaca ggttctggcg gcagagcccg gggcctgtgc 60
tacacctgcg gatcccctgg acactaccag gcccagtgtc ctaagaaaag aaagtctggt 120
aacagcagag agcggtgcca gctgtgtgat ggcatgggcc acaacgccaa acagtgccgg 180
agacgggacg gaaaccaagg acaaagaccc ggccggggac tgagcagcgg accttggcct 240
gtcagccagc aacctgccgt gtcc 264
<210> 197
<211> 26
<212> RNA
<213> Unknown
<220>
<223> Planctomycetes sp.
<400> 197
ucuccgauaa auaagaagca ucaaag 26
<210> 198
<211> 384
<212> DNA
<213> Alpharetrovirus Avian Leukosis virus
<400> 198
ctggctatga ccatggaaca caaggaccgg cctctggtgc gggtgatcct gacaaatacc 60
ggctctcacc ccgtgaagca gcggtcagtg tacatcacag ccctgctgga cagcggcgct 120
gatatcacca tcattagcga ggaggactgg cctaccgact ggcccgtgat ggaagctgcc 180
aatccccaga tccacggcat cggaggcgga atcccgatga gaaagtccag agacatgatc 240
gaggtgggcg tgatcaaccg ggacggctct cttgagagac ctctgctgct gttccccgcc 300
gtggctatgg tgcgaggcag catcctgggc cgcgactgcc tgcagggcct gggcctgaga 360
ctgaccaacc tgaactttag ccag 384
<210> 199
<211> 465
<212> DNA
<213> Alpharetrovirus Rous sarcoma virus
<400> 199
atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60
ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120
agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180
cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240
ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300
ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360
agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420
cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttac 465
<210> 200
<211> 252
<212> DNA
<213> Alpharetrovirus Rous sarcoma virus
<400> 200
cactgcggca ccgccattgg atgtaactgc gctacagcca gcgccccccc ccctccctac 60
gtgggcagcg gactttatcc tagcctggcc ggcgtgggag agcagcaggg ccaaggcgga 120
gatacaccca gaggcgccga gcagcctaga gccgaacccg gccacgccgg actggcccct 180
ggcccagccc tgaccgactg ggcccgcatc cgggaagaac tggcttctac cggccccccg 240
gtggtcgcca tg 252
<210> 201
<211> 267
<212> DNA
<213> Alpharetrovirus Rous sarcoma virus
<400> 201
gccgtggtga acagagagag agacggccag acaggctccg gcggccgggc cagagagctg 60
tgctacacct gtggctctcc aggccactac caggctcagt gtcctaaaaa gcggaagtct 120
ggcaattcta gagagcggtg ccagctgtgc aacggcatgg gccataatgc caaacagtgt 180
cggaaacggg acggaaacca gggccagaga ccaggcagag gcctgtcttc tggcccctgg 240
cccggccctg agcctcctgc tgtgtcc 267
<210> 202
<211> 21
<212> RNA
<213> Artificial Sequence
<220>
<223> scaffold stem loop
<400> 202
ccagcgacua ugucguagug g 21
<210> 203
<211> 31
<212> RNA
<213> Artificial Sequence
<220>
<223> stem loop sequence
<220>
<221> misc_feature
<222> (4)..(28)
<223> n is any ribonucleotide
<220>
<221> misc_feature
<222> (8)..(28)
<223> These individual nucleotides may be absent
<400> 203
uuunnnnnnn nnnnnnnnnn nnnnnnnnuu u 31
<210> 204
<211> 19
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 204
acaugaggau uacccaugu 19
<210> 205
<211> 18
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 205
ugcaugucua agacagca 18
<210> 206
<211> 20
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 206
aauccauugc acuccggauu 20
<210> 207
<211> 12
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 207
ccucuucgga gg 12
<210> 208
<211> 21
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 208
aggaguuucu auggaaaccc u 21
<210> 209
<211> 30
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 209
aggugggacg accucucggu cguccuaucu 30
<210> 210
<211> 19
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 210
ugcucgcucc guucgagca 19
<210> 211
<211> 21
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 211
ugcucgacgc guccucgagc a 21
<210> 212
<211> 22
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 212
ugcucguuug cggcuacgag ca 22
<210> 213
<211> 17
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 213
agggagggag ggagagg 17
<210> 214
<211> 19
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 214
gguuaggguu aggguuagg 19
<210> 215
<211> 25
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 215
cugcucagua cgagaggaac cgcag 25
<210> 216
<211> 78
<212> RNA
<213> Unknown
<220>
<223> exogenous stem loop region
<400> 216
uacacuggga ucgcugaauu agagaucggc guccuuucau ucuauauacu uuggaguuuu 60
aaaaugucuc uaaguaca 78
<210> 217
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 217
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
His Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 218
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 218
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 219
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 219
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn His Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 220
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 220
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Ala
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser
225 230 235 240
Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val
245 250 255
Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys
260 265 270
Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp
305 310 315 320
Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 221
<211> 979
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 221
Arg Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys
100 105 110
Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe
115 120 125
Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln
130 135 140
Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu
165 170 175
Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His
195 200 205
Pro Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly
210 215 220
Ala Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala
225 230 235 240
Ser Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val
245 250 255
Val Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly
260 265 270
Lys Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His
275 280 285
Thr Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg
290 295 300
Met Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp
305 310 315 320
Asp Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu
325 330 335
Val Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn
340 345 350
Val Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp
355 360 365
Gln Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu
370 375 380
Ser Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln
385 390 395 400
Leu Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp
405 410 415
Gly Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu
420 425 430
Gly Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp
435 440 445
Ala Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser
450 455 460
Phe Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg
465 470 475 480
Cys Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro
485 490 495
Phe Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser
500 505 510
Lys Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys
515 520 525
Leu Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg
530 535 540
Phe Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr
545 550 555 560
Val Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe
565 570 575
Asn Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys
580 585 590
Arg Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr
595 600 605
Gly Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr
610 615 620
Asn Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr
625 630 635 640
Phe Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn
645 650 655
Leu Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu
660 665 670
Thr Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly
675 680 685
Asn Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln
690 695 700
Arg Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly
705 710 715 720
Tyr Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met
725 730 735
Val Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp
740 745 750
Ala Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly
755 760 765
Lys Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp
770 775 780
Leu Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser
785 790 795 800
Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe
805 810 815
Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys
820 825 830
Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val
835 840 845
Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val
850 855 860
Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn
865 870 875 880
Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser
885 890 895
Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val
900 905 910
Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu
915 920 925
Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys
930 935 940
Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val
945 950 955 960
Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys
965 970 975
Pro Ala Val
<210> 222
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 222
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Gln Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 223
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 223
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Thr Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 224
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 224
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Arg Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 225
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 225
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Tyr Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 226
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 226
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
His Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 227
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 227
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Ala Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 228
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 228
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Ala Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 229
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 229
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Arg Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys
100 105 110
Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe
115 120 125
Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln
130 135 140
Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu
165 170 175
Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His
195 200 205
Pro Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser
225 230 235 240
Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val
245 250 255
Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys
260 265 270
Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp
305 310 315 320
Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 230
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 230
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Tyr Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 231
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 231
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Asn Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 232
<211> 979
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 232
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Trp Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser
785 790 795 800
Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe
805 810 815
Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys
820 825 830
Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val
835 840 845
Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val
850 855 860
Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn
865 870 875 880
Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser
885 890 895
Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val
900 905 910
Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu
915 920 925
Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys
930 935 940
Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val
945 950 955 960
Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys
965 970 975
Pro Ala Val
<210> 233
<211> 979
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 233
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Tyr Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser
785 790 795 800
Lys Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe
805 810 815
Thr Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys
820 825 830
Thr Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val
835 840 845
Glu Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val
850 855 860
Lys Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn
865 870 875 880
Asn Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser
885 890 895
Leu Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val
900 905 910
Cys Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu
915 920 925
Asn Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys
930 935 940
Tyr Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val
945 950 955 960
Glu Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys
965 970 975
Pro Ala Val
<210> 234
<211> 393
<212> DNA
<213> Alpharetrovirus Rous sarcoma virus
<400> 234
ctggctatga ccatggaaca caaggacaga cccctggtgc gggtgatcct gacaaacacc 60
ggaagccacc ccgtgaagca gcgctccgtg tacatcacag cccttctgga cagcggcgcc 120
gacatcacca tcatcagcga ggaagattgg cctacagact ggcctgtgat ggaagccgca 180
aacccccaga tccacggcat cggcggaggt atacccatgc ggaagagcag agacatgatc 240
gagctgggcg tgatcaaccg ggacggcagc ctggaacggc ccctgctgtt gtttcctgct 300
gtggctatgg tgcggggaag catcctgggc agagattgcc tgcagggcct gggcctgcgc 360
ctgaccaacc tgtgaggagg gccactgttc tca 393
<210> 235
<211> 270
<212> DNA
<213> Betaretrovirus enzootic nasal tumor virus
<400> 235
atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60
agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120
tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180
cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240
ttctggaccc tgatccgcga ctgcctggat 270
<210> 236
<211> 546
<212> DNA
<213> Betaretrovirus enzootic nasal tumor virus
<400> 236
ttcgacaatg acgagctgaa aagactgggc aacctgctca agcaggagga agatcctctg 60
cacgaccctg acagcgagaa cagctacgac gcccctcctc ctcctcatcc tagcctgcac 120
tctagcagac cttccgacaa cgacgacctg ctgtctagca cagacgaggc cgagctggac 180
gaggaagccg ccaagtacca ccaggaggac tggggcttcc tggctcagga gaaaggcgcc 240
ctgacaagca aggacgagct ggtggaatgt ttcaagaacc tgaccatcgc cctgcagaac 300
gctggaatca agctgccagc caacaacgat aagttcccct ccgccccccc tctgcctcct 360
gcctacgccc ctagcgtggt ggccggactg gatccacccc ccggccccct gcccccaagc 420
aagaacatgt ctccactgca gaaagccctg agacaagccc agaggctggg cgaagttgtg 480
tccgatttca gcctggcctt ccccgtgttc gagaacaaca accagcggta ctacgagagc 540
ctgcct 546
<210> 237
<211> 618
<212> DNA
<213> Betaretrovirus enzootic nasal tumor virus
<400> 237
ttcaagcagc tgaaggaact caaaatcgca tgcagccagt acggccctac cgcacctttt 60
accatcgcca tgatcgagaa cctcggcacc caggccctgc cacctaatga ttggaagcag 120
acagccagag cctgcctgtc aggcggagat tacctgctgt ggaagagcga gttcttcgag 180
caatgcgcca gaatcgctga cgtgaaccgg cagcagggca tccagacgag ctacgagatg 240
ctgatcggcg agggacccta ccaggccacc gacacccagc tgaacttcct gcctggggcc 300
tatgcccaaa tcagcaacgc cgccagacag gcttggaaga aactgcctag ctcttctaca 360
aagaccgagg acctgagcaa agtgcggcaa ggccccgatg agccctacca ggactttgtc 420
gccagactgc tcgacaccat cggcaagatc atgagcgacg aaaaggccgg catggtcctg 480
gctaagcaac tggctttcga gaatgctaat agcgcctgtc aggccgccct gcggccttac 540
agaaagaagg gcgacctgtc cgattttatc agaatctgcg ccgacatcgg cccctcttat 600
atgcagggaa ttgccatg 618
<210> 238
<211> 405
<212> DNA
<213> Betaretrovirus enzootic nasal tumor virus
<400> 238
gccgctgctc tgcagggcaa aagcatcaag gaagtgcttt tccagcagca agctcggaac 60
aagcggggaa gacagagaag cggcaatagc ggttgttttg tgtgcggcca gcccggccac 120
cgcgccgccg tgtgccccca gaagcagcag agccccgtga acacccctaa tctgtgcccg 180
cgctgtaaaa aaggaaagca ttgggcacga gattgccggt ccaaaacaga tgttcaaggt 240
acccctttac ccccggtgtc gggaaactgg gtgaggggcc agcccctggc cccgaaacaa 300
tgttatgggg caacactgca ggttccaaaa gaaccattgc agacctctgt cgagccacaa 360
gaggcagcgc gggattggac ctctgtgcca cctcctacac agtat 405
<210> 239
<211> 999
<212> DNA
<213> Betaretrovirus enzootic nasal tumor virus
<400> 239
aaaaggaaag cattgggcac gagattgccg gtccaaaaca gatgttcaag gtaccccttt 60
acccccggtg tcgggaaact gggtgagggg ccagcccctg gccccgaaac aatgttatgg 120
ggcaacactg caggttccaa aagaaccatt gcagacctct gtcgagccac aagaggcagc 180
gcgggattgg acctctgtgc cacctcctac acagtattaa ctcccgagat gggggtccaa 240
accctggcta caggcgtgtt cggtcctctg ccccccggca ccgccggcct gctgctgggc 300
agaagcagcg ccagcctgaa gggcatcctg atccatcctg gagtgattga cagcgactac 360
accggcgaga tcaagatcct ggcctctgcc cctaacaaga tcatcgtgat caacgccggc 420
caaagaatcg cccagctgct gctcgtgcct ctggtgatcc agggcaaaac catcaaccgg 480
gacaggcagg acaagggatt tggatcttct gacgcctatt gggtgcagaa cgtgaccgag 540
gccagacctg aactggaact tagaatcaat ggcaagctgt tccggggcgt gctggataca 600
ggcgccgaca tcagcgtgat cagcgacaaa tactggccca ccacctggcc taagcagatg 660
gctatctcta cactgcaggg catcggccag acaaccaacc ccgagcagag cagcagcctg 720
ctgacctgga aggacaagga cggccacacc ggccaattca agccctacat cctgcctcac 780
ctgcctgtga acctgtgggg cagagatatc ctgagcaaga tgggcgtcta cctgtactcc 840
cctagcccta ccgtgacaga tctgatgctg gaccagggcc tgctgcctaa tcagggcctc 900
ggaaagcaac accagggaat tatcctgcca ctggacctga aaagcaacca ggatagaaag 960
ggcctgggat gcttcccctg aggacctctg attctcctg 999
<210> 240
<211> 297
<212> DNA
<213> Betaretrovirus mouse mammary tumor virus
<400> 240
atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60
tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120
aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180
ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240
tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctg 297
<210> 241
<211> 288
<212> DNA
<213> Betaretrovirus mouse mammary tumor virus
<400> 241
ctgagcgccg aggccaagtc cgtgacagag gaagaactgg aagaaggcct gacaggactg 60
ctgagcgcca gcagccagga gaagacctac ggcacaagag gcaccgccta tgccgaaatc 120
gacaccgagg tggataagct gagcgagcac atctacgacg agccctacga ggagaaggaa 180
aaggccgaca agaacgagga gaaggaccac gtgcggaagg tcaagaagat cgtgcaaaga 240
aaggaaaata gcgagcataa gagaaaggag aaagatcaga aggccttc 288
<210> 242
<211> 222
<212> DNA
<213> Betaretrovirus mouse mammary tumor virus
<400> 242
ctggcaaccg actggaacaa cgacgacctg agccctgagg actgggacga cctggaagag 60
caggccgccc actaccacga tgacgacgaa ctgatcctgc ctgtgaagag aaaggtggac 120
aagaagaagc cgctcgccct gaggcggaaa cctctgcccc cggttggctt cgccggagcc 180
atggccgagg ctagagagaa gggcgatctg accttcacat tt 222
<210> 243
<211> 681
<212> DNA
<213> Betaretrovirus mouse mammary tumor virus
<400> 243
cccgtggttt tcatgggaga atccgacgac gatgataccc ctgtgtggga acctctgccc 60
ctgaagacac tgaaggaact gcagtctgcc gtgcggacca tgggccctag cgccccttac 120
accctccagg tggtggacat ggttgcctct cagtggctga cacctagcga ttggcaccaa 180
accgccagag ccaccctgtc tcctggggac tacgtgctgt ggcggaccga gtacgaggag 240
aagagcaagg aaaccgtgca gaagaccgct ggcaagcgga aaggcaaggt gagcctggat 300
atgctgctgg gcacaggtca gttcctgagc ccttcttctc agatcaagct ttctaaagat 360
gtgctgaagg atgtgaccac caacgccgtc ctggcctgga gagccatccc tcctccaggc 420
gtcaaaaaga cagtgctggc cggactcaag cagggaaatg aggaaagcta cgagacattc 480
atcagcagac tggaagaggc cgtgtacaga atgatgccta gaggagaagg cagcgacatc 540
ctgatcaagc agctggcttg ggagaacgct aattctctgt gccaggacct gatccggcct 600
atgcggaaga ccggcaccat gcaggactac atcagagcct gtctggatgc ctcccctgcc 660
gtggtgcagg gcatggccta c 681
<210> 244
<211> 723
<212> DNA
<213> Betaretrovirus mouse mammary tumor virus
<400> 244
gccgccgcaa tgagaggaca aaagtacagc accttcgtga aacagacata cggcggcgga 60
aaaggcggac agggctctga aggccctgtg tgcttcagct gcggcaaaac aggtcacatt 120
aagcgggatt gcaaggaaga gaaaggaagc aagcgcgctc ctcctggact gtgtcctaga 180
tgcaagaaag gctaccactg gaagagcgag tgcaagagca agttcgacaa ggacggcaac 240
cctctgccac cactggaaac taacgccgaa aacagcaaaa accccacaca gaaaggcgac 300
aaaggaaagg acagcggact gaaccccgaa gcccctcctt tcaccatcca cgacctgcca 360
cgaggcaccc caggcagtgc cggcttggac ctgagcagcc agaaagacct gatcctgtct 420
ctggaagacg gcgtgtccct ggtgccaacc ctggtgaagg gcaccctgcc cgagggcacc 480
acgggactga tcatcggcag atccagcaac tacaagaaag gcctggaggt gctgcccggc 540
gtgatcgact ccgacttcca gggcgaaatt aaggtcatgg taaaggccgc taagaacgcc 600
gtgatcatcc acaagggcga gcggatcgcg cagctgctgc tgctgcctta tctgaaactg 660
cctaacccta tcatcaagga ggaaagaggc agcgagggat ttggcagcac ctcccacgtg 720
cac 723
<210> 245
<211> 360
<212> DNA
<213> Betaretrovirus mouse mammary tumor virus
<400> 245
tgggtgcagg agatcagcga cagcagaccc atgctgcaca tcagcctgaa cggcagaaga 60
ttcctgggcc tgctggacac cggggccgat aagacctgca tcgccggcag agattggccc 120
gccaactggc ctattcacca gaccgagagc agcctgcagg gcttgggaat ggcttgtggc 180
gtggctagaa gctctcagcc tctgagatgg cagcacgagg ataagtctgg cattatccat 240
cctttcgtga tccccacatt gccttttacc ctctggggcc gggacatcat gaaagagata 300
aaggtgcggc tgatgaccga tagcccagac gacagccagg atctgacatc tctgtacggc 360
<210> 246
<211> 300
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 246
atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60
acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120
acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180
gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240
agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300
<210> 247
<211> 348
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 247
gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 60
accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 120
tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 180
ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 240
gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 300
agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatg 348
<210> 248
<211> 249
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 248
gccgtggtga accctaaaga ggaactgaaa gaaaagatcg cccagctgga agagcagatc 60
aaactggaag agctgcacca ggccctgatt tctaagctgc aaaagctgaa aaccggcaac 120
gagacagtca ctcaccctga tacagccgga ggcctgagca gaacaccaca ttggcccggc 180
cagcacatcc ctaagggcaa gtgctgcgcc agccgggaaa aggaagagca gatccccaag 240
gatatcttc 249
<210> 249
<211> 678
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 249
cctgtgaccg aaaccgttga cggacagggc caggcatgga gacaccacaa tggcttcgac 60
ttcgccgtga tcaaggaact gaagacagcc gcctctcaat acggcgccac cgcaccttac 120
accctggcta tcgtggaatc cgtcgccgac aactggctga ccccaaccga ctggaatacc 180
ctggtgcggg ccgtgctgtc tggcggcgac cacctgctct ggaagtctga gttcttcgag 240
aactgtaggg acaccgctaa gcggaaccag caggccggca atggatggga ttttgacatg 300
ctgaccggca gcggcaacta cagctctaca gacgcccaaa tgcagtacga ccctggcctg 360
ttcgcccaga ttcaggccgc tgccacaaag gcctggcgga agctgcccgt gaagggggat 420
cccggcgcca gcctgaccgg cgtgaagcag ggccccgatg agcctttcgc cgacttcgtg 480
catagactga tcaccacagc cggcagaatc ttcggctccg ccgaagccgg cgtggactac 540
gtgaagcagc tggcttacga gaacgccaac cctgcctgcc aggccgcaat cagaccctat 600
agaaagaaga cagatctgac cggctacatc cggctgtgca gcgacatcgg cccttcctat 660
cagcagggac tggctatg 678
<210> 250
<211> 694
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 250
gccgctgcct ttagcggcca gaccgtgaag gacttcctga acaacaagaa caaggaaaag 60
ggcggatgtt gttttaagtg cggcaagaaa ggacactttg ccaaaaactg ccacgagcac 120
gcccacaaca acgccgagcc caaggtgccc ggcctgtgtc ctcggtgcaa gagaggcaag 180
cactgggcca atgagtgcaa gtccaagaca gataaccagg gaaatccaat ccccccccat 240
cagggaaatg gtgcttctcc tagacctaga aacaagctga tgggccaaag cgccctgttc 300
cagcctacca agacaaccca cttcaaggcc taccagagcc accccagaaa gtgcagaatc 360
ggccctctgt tccacctgcc ccacagcatc aacgcctgaa atggggcccc aagcgttaag 420
cactggaata tatggaccac tgcctcccaa cacttttgga ttaatcctag gccgaagtag 480
cattactatg aagggtctac aagtttatcc aggagtaatt gataatgact ataccggaga 540
aattaaaatt atggcaaaag ctgttaacaa tattgttact gtctctcaag gcaacagaat 600
agctcaatta atcctcctgc ctctgatcga gacagacaat aaggtacaac aaccttatag 660
aggacaagga agttttggat cctcagacat atat 694
<210> 251
<211> 459
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 251
tgggtccagc ctatcacctg tcagaagcct tctctgaccc tgtggctgga cgacaagatg 60
ttcaccggcc tcatcgacac cggcgccgac gtgacaatca tcaagctgga agattggcct 120
ccaaattggc ccattacaga taccctgacc aacctgagag gcatcggaca gtccaacaac 180
cccaagcaga gcagcaagta cctgacatgg cgggacaagg agaacaacag cggcctgatc 240
aaaccttttg tgatccccaa tctgcctgtg aacctgtggg gaagagatct gctgtctcag 300
atgaagatca tgatgtgcag cccaaacgac atcgtgaccg cccagatgct ggctcaaggc 360
tacagccccg gcaaaggcct gggcaagaaa gagaatggaa tcctgcaccc tatccctaac 420
cagggccaga gcaacaagaa gggcttcggc aacttctga 459
<210> 252
<211> 300
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 252
atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60
acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120
acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180
gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240
tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300
<210> 253
<211> 348
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 253
gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 60
acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 120
agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 180
ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 240
gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 300
cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatg 348
<210> 254
<211> 249
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 254
gcggttgtta atccaaaaga ggagctcaaa gaaaaaattg ctcaattaga ggaacagatt 60
aaattagaag agttacacca ggcactaatt tccaaattac aaaaactaaa aacagggaat 120
gaaactgtaa ctcacccaga cacagcagga ggcctttctc gcacgcctca ctggccaggg 180
caacatatcc ctaaaggaaa atgttgcgcc agtcgagaaa aggaagaaca aatcccaaaa 240
gatattttc 249
<210> 255
<211> 678
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 255
ccagtgactg aaaccgttga tgggcaaggt caagcctgga gacaccataa tggttttgat 60
tttgccgtca taaaagaatt aaaaacagct gcttcccaat atggggctac tgccccatac 120
acattagcca tagtggaatc tgtagcggac aattggctta cccctacaga ttggaatacg 180
cttgttaggg cagtcctctc aggaggagat cacttactgt ggaaatctga gttttttgaa 240
aattgcagag atacggctaa aagaaaccaa caagccggta atggctggga ttttgacatg 300
ttaacaggtt cgggtaatta ttccagcacc gatgcacaaa tgcagtatga tccaggattg 360
tttgctcaaa ttcaagcggc tgctacaaaa gcctggagaa aacttcccgt taagggagac 420
ccaggagcct cccttacagg agtcaaacaa ggacccgatg agccatttgc agatttcgta 480
cacagactta taacaactgc tgggagaatc tttggaagtg ctgaggccgg tgtagactat 540
gtaaaacaac tagcatatga aaatgctaat ccagcttgtc aggcagccat tcgcccctat 600
agaaagaaga cagatttaac tggctatatc cgtctttgct cggatattgg gccctcttat 660
cagcaaggcc tggccatg 678
<210> 256
<211> 694
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 256
gccgccgcct ttagcgggca gactgtaaaa gattttctta acaacaaaaa taaagagaaa 60
ggagggtgtt gctttaaatg cggtaaaaaa ggacactttg caaaaaattg tcatgaacat 120
gcacataaca atgctgaacc aaaagttccc ggactctgcc ctagatgtaa aagagggaaa 180
cattgggcca atgaatgcaa atccaaaact gataatcaag gaaacccaat accaccccat 240
cagggaaacg gggccagccc caggccccga aacaagctta tggggcagtc agctttgttc 300
cagccaacaa aaacaaccca tttcaaagct taccagagcc accccaggaa gtgcaggatt 360
ggacctctgt tccacctccc acacagtatt aacgcctgaa atggggcccc aagcgttaag 420
cactggaata tatggaccac tgcctcccaa cacttttgga ttaatcctag gccgaagtag 480
cattactatg aagggtctac aagtttatcc aggagtaatt gataatgact ataccggaga 540
aattaaaatt atggcaaaag ctgttaacaa tattgttact gtctctcaag gcaacagaat 600
agctcaatta atcctcctgc ctctgatcga gacagacaat aaggtacaac aaccttatag 660
aggacaagga agttttggat cctcagacat atat 694
<210> 257
<211> 459
<212> DNA
<213> Betaretrovirus Mason-Pfizer monkey virus
<400> 257
tgggtccaac ctattacttg tcaaaaacct tccttaacat tatggttaga tgacaaaatg 60
ttcacaggct taatagatac gggggctgat gtcacaatta tcaagctgga ggactggcct 120
cctaattggc ctataacaga taccttaacc aatttaagag gaataggaca aagtaacaac 180
cctaaacaaa gttctaaata tcttacttgg agagataaag aaaacaattc tggtctcatc 240
aaaccgtttg ttattcctaa cttacctgtc aatctttggg gccgagattt actttctcaa 300
atgaaaatta tgatgtgtag ccccaatgac atagtaactg ctcaaatgtt agcccagggc 360
tacagcccag gaaaagggtt aggaaaaaag gaaaatggca ttctacatcc tatcccaaat 420
caaggacaat ctaacaaaaa aggttttgga aatttttaa 459
<210> 258
<211> 327
<212> DNA
<213> Deltaretrovirus Bovine leukemia virus
<400> 258
atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60
ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120
aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180
ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240
aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300
ccaccctacg accctccagc catcctg 327
<210> 259
<211> 639
<212> DNA
<213> Deltaretrovirus Bovine leukemia virus
<400> 259
cccatcatct ccgagggaaa caggaatagg cacagggcat gggcactgag ggagctgcag 60
gatatcaaga aggagatcga gaataaggcc cctggctctc aagtgtggat ccagacactg 120
cggctggcca tcctgcaggc agacccaacc cctgcagatc tggagcagct gtgccagtac 180
atcgccagcc ctgtggacca gaccgcccac atgacatccc tgaccgcagc aatcgcagca 240
gcagaggcag caacacccag cagagtgctg acccctaaga ccggcacact gacccagcag 300
tctgcccagc caaacgcagg cgatctgagg agccagtatc agaatctgtg gctgcaggcc 360
ggcaagatct ccctgctggt gctgcagctg cagccctggt ctaccatcgt gcagggacct 420
gcagagagct ccgtggagtt tgtgaaccgc ctgcagatct ccctggccga caacctgcca 480
gatggcgtgc tgcggaatcc cctgctgaca cctctggtca tgcagatgct gaccgagtct 540
gtgagcaagt tctgcagggg agaggccagc ggaaggggag gagccaagac agcaggactg 600
agaaccatcg gaccacctag gatgaagcag cctgccctg 639
<210> 260
<211> 291
<212> DNA
<213> Deltaretrovirus Bovine leukemia virus
<400> 260
ctggtgcaca ccccaggacc aaagatgcct ggaccacgcc agccagcacc taagaggcca 60
ccacctggac cttgctacag atgtctgaag gagggacact gggccaggga ctgcccaaca 120
aaggcaaccg gcccaccacc tggaccatgc cccatctgta aggacccaag ccactggaag 180
cgcgattgtc ccacactgaa gtccaagaat ctaatagagg ggggacttag cgccccccaa 240
accataacac ctataacaga ttctcttagt gaggccgaat tagaatgctt a 291
<210> 261
<211> 378
<212> DNA
<213> Deltaretrovirus Bovine leukemia virus
<400> 261
ctctctattc ctctggcccg gagccgccct agcgtggccg tgtacctgag cggcccttgg 60
ctgcaacctt ctcagaacca ggccctgatg ctggttgata caggcgccga gaacaccgtg 120
ctgcctcaga attggctggt gcgggactac cccagaatcc ctgccgctgt gctgggagcc 180
ggaggcgtgt cccggaacag atacaactgg ctgcagggcc ctcttacact ggctctgaaa 240
cctgaaggcc cattcatcac catcccaaag atcctggtcg acaccttcga caagtggcag 300
atcctgggca gagatgtgct gagcagactg caggccagca tcagcatccc cgaggaagtg 360
cggccccccg tggtgggc 378
<210> 262
<211> 40
<212> DNA
<213> Deltaretrovirus Bovine leukemia virus
<400> 262
aggtgcccca gccatcctgc ccatcatctc cggcggcagc 40
<210> 263
<211> 390
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 263
atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60
gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120
tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180
tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240
aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300
cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360
tacgtggagc ccaccgcccc tcaagtgctg 390
<210> 264
<211> 642
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 264
ccagtgatgc acccccacgg cgcccctcct aatcacagac cttggcagat gaaagacctg 60
caggccatca agcaggaagt gtcccaggcc gctcctggca gcccccaatt tatgcagacc 120
atcagactcg ccgttcagca gttcgacccc acagccaagg atctgcagga cctgctgcag 180
tacctgtgta gcagcctggt cgccagcctg caccatcagc aactggattc tctgatcagc 240
gaggccgaga caagaggcat caccggctac aaccctctgg ccggccccct gcgggtgcag 300
gcaaacaacc cccagcagca ggggctgcgg agagagtacc agcagctgtg gctggctgct 360
ttcgccgcac tgcctggaag cgccaaagat ccatcttggg cctctatcct gcagggcctg 420
gaagaacctt accacgcctt tgtggaaaga ctgaacatcg ccctggacaa cggcctgcct 480
gagggcaccc ctaaggaccc catcctgaga tctctggcct acagcaacgc caacaaggaa 540
tgtcagaagc tgctgcaagc cagaggccac accaacagcc ccctgggcga catgctgcgc 600
gcctgccaga cctggacccc taaggacaag accaaggtgc tg 642
<210> 265
<211> 314
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 265
gtggtgcagc ctaagaagcc tccccctaat cagccctgct tccggtgcgg caaggccgga 60
cactggagcc gggactgcac ccagcctcgg cctccaccgg gaccttgtcc tctgtgccaa 120
gaccccacac actggaagag agattgcccc cgcctaaagc ccactatccc agaaccagag 180
ccagaggaag atgccctcct attagacctc cccgctgaca ttccacaccc aaaaaactcc 240
ataggggggg aggtttaacc tctcctccta ccctgcagca ggtgttcctg aatcaagatc 300
ctgccagcat cctg 314
<210> 266
<211> 546
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 266
acctcccacc ccaaaacaat cgaggccctg ctggacaccg gcgctgatat gacagtgctg 60
ccaatcgccc tgttcagcag caacacccct ctgaaaaaca ccagcgtgct cggagccggc 120
ggacagaccc aggaccactt caagctgaca agcctgcctg tcctgatccg gctgcccttc 180
agaaccacac ctatcgtgct gaccagctgc ctggtggaca caaagaacaa ctgggccatc 240
atcggcaggg acgccctgca acagtgccag ggcgtgctgt acctgccaga ggccaagggc 300
ccccccgtta tcctgcctat ccaggcccct gccgtgctgg gcctggaaca cctgccaaga 360
cccccccaga tcagccaatt tcctctgaac cagaacgcca gcagaccatg taatacctgg 420
tccggcagac cttggcggca ggccatttct aaccccaccc ccggccagga gatcacccag 480
tacagccagc tgaagcggcc tatggaacct ggagattcta gcaccacctg cggccctctg 540
acactg 546
<210> 267
<211> 39
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 267
ggtgcccctc aagtgctgcc agtgatgcac ggcggcagc 39
<210> 268
<211> 390
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 268
atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60
gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120
tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180
tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240
aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300
ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360
tatgttgagc ctacggcccc ccaagtcctt 390
<210> 269
<211> 642
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 269
ccagtcatgc atccacatgg tgctcctcct aaccatcgcc catggcaaat gaaagaccta 60
caggccatta agcaagaagt ctcccaagca gcccctggga gcccccagtt tatgcagacc 120
atccggcttg cggtgcagca gtttgacccc actgccaaag acctccaaga cctcctgcag 180
tacctttgct cctccctcgt ggcttccctc catcaccagc agctagatag ccttatatca 240
gaggccgaaa cccgaggtat tacaggttat aacccattag ccggtcccct ccgtgtccaa 300
gccaacaatc cacaacaaca aggattaagg cgagaatacc agcaactctg gctcgccgcc 360
ttcgccgccc tgccggggag tgccaaagac ccttcctggg cctctatcct ccaaggcctg 420
gaggagcctt accacgcctt cgtagaacgc ctcaacatag ctcttgacaa tgggctgcca 480
gaaggcacgc ccaaagaccc catcttacgt tccttagcct actccaatgc aaacaaagaa 540
tgccaaaaat tactacaggc ccgaggacac actaatagcc ctctaggaga tatgttgcgg 600
gcttgtcaga cctggacccc caaagacaaa accaaagtgt ta 642
<210> 270
<211> 314
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 270
gttgtccagc ctaaaaaacc ccccccaaat cagccgtgct tccggtgcgg gaaagcaggc 60
cactggagtc gggactgcac tcagcctcgt cccccccccg ggccatgccc cctatgtcaa 120
gacccaactc actggaagcg agactgcccc cgcctaaagc ccactatccc agaaccagag 180
ccagaggaag atgccctcct attagacctc cccgctgaca ttccacaccc aaaaaactcc 240
ataggggggg aggtttaacc tcccccccca cattacagca agtctttctt aaccaagacc 300
cagcatctat tctg 314
<210> 271
<211> 606
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 271
ccagttatac cgttagatcc cgcccgtcgg cccgtaatta aagcccaggt tgacacccag 60
accagccacc caaagactat cgaagctcta ctagatacag gagcagacat gacagtcctt 120
ccgatagcct tgttctcaag taatactccc ctcaaaaata catccgtatt aggggcaggg 180
ggccaaaccc aagatcactt taagctcacc tcccttcctg tgctaatacg cctccctttc 240
cggacaacgc ctattgtttt aacatcttgc ctagttgata ccaaaaacaa ctgggccatc 300
ataggtcgcg atgccttaca acaatgccag ggcgtcctgt acctccctga ggcaaaaggg 360
ccgcctgtaa tcttgccaat acaggcgcca gccgtccttg gactagaaca cctcccaagg 420
cccccccaaa tcagccagtt ccctttaaac cagaacgcct ccaggccttg caacacttgg 480
tccggaaggc cctggaggca ggccatatcg aatcctacac cgggccagga aataacccag 540
tattcccagt taaaaaggcc aatggaacct ggcgattcat ccacgacctg cgggccacta 600
actctc 606
<210> 272
<211> 36
<212> DNA
<213> Deltaretrovirus human T-lymphotropic virus
<400> 272
gcccctcaag tgctgccagt gatgcacggc ggcagc 36
<210> 273
<211> 285
<212> DNA
<213> Epsilonretrovirus Walleye dermal sarcoma virus
<400> 273
atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60
accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120
aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180
gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240
cgggtgaaga tccaggccag aaagggagag accgcaaggc agatg 285
<210> 274
<211> 468
<212> DNA
<213> Epsilonretrovirus Walleye dermal sarcoma virus
<400> 274
accgcacaca caatcaagaa gctgatcgtg ggcacaatcg ataagaacaa gcagcagacc 60
gagatcctgc agaagacaga cgagagcgat gaggagatgg acaccacaaa taccatgctg 120
tttatcgccc gcaacaagag ggagaggatc gcacagcagc agcaggcaga tctggcagca 180
cagcagcagg tgctgctgct gcagagggag cagcagaggg agcagagaga gaaggatatc 240
aagaagcggg acgagaagaa gaagaagctg ctgcccgaca ccacacagaa ggtggagcag 300
accgatatcg gagaggccag ctcctctgac gcctccgccc agaagccaat ctctaccgac 360
aacaatcccg atctgaaggt ggacggcgtg ctgacaagaa gccagcacac cacagtgcct 420
tccaacatca ccatcaagaa ggatggcaca tccgtgcagt accagcac 468
<210> 275
<211> 618
<212> DNA
<213> Epsilonretrovirus Walleye dermal sarcoma virus
<400> 275
cccatcagga actatcctac cggcgagggc aatctgacag cccaggtgcg gaaccctttt 60
agaccactgg agctgcagca gctgaggaag gactgccccg ccctgcctga gggcatccca 120
cagctggccg agtggctgac ccagacaatg gccatctaca attgtgacga ggccgatgtg 180
gagcagctgg ccagagtgat cttcccaacc cctgtgaggc agatcgcagg cgtgatcaac 240
ggacacgcag cagcaaatac cgcagccaag atccagaact acgtgacagc atgcaggcag 300
cactatccag ccgtgtgcga ttggggcacc atccaggcct ttacatacaa gccccctcag 360
accgcccacg agtatgtgaa gcacgccgag atcatcttca agaacaatag cggactggag 420
tggcagcacg caaccgtgcc ttttatcaat atggtggtgc agggcctgcc acccaaggtg 480
acacggtccc tgatgtctgg caacccagat tggagcacca agacaatccc acagatcatc 540
cccctgatgc agcactacct gaatctgcag tccagacagg acgccaagat caagcagacc 600
cctctggtgc tgcagctg 618
<210> 276
<211> 381
<212> DNA
<213> Epsilonretrovirus Walleye dermal sarcoma virus
<400> 276
gccatgccag cccagacaat gaacggcaat aagggctacg tgggctccta tcctaccaac 60
gagccatact attctttcca gcagcagcag aggccagcac ccagagcccc tccaggcaac 120
gtgccttcca atacctgctt cttttgtaag cagccaggac actggaaggc agactgccct 180
aataagacaa ggaacctgcg caatatgggc aacatgggaa ggggaggaag aatgggagga 240
ccaccttacc ggagccagcc ttatccagcc tttatccagc caccccagaa tcaccagaac 300
cagtataatg gcaggatgga tcgctctcag ctgcaggcca gcgcccagga gtggctgcca 360
ggaacctacc ctgcacgaga c 381
<210> 277
<211> 429
<212> DNA
<213> Epsilonretrovirus Walleye dermal sarcoma virus
<400> 277
ccaatcgatt gcccctatga gaagagcggc acaaagacca cacaggacgt gatcaccaca 60
aagaatgccg agatcatggt gaccgtgaac cacacaaaga tcccaatgct ggtggatacc 120
ggcgcctgtc tgacagcaat cggaggagca gcaaccgtgg tgccagacct gaagctgacc 180
aacacagaga tcatcgcagt gggaatctct gccgagcccg tgcctcacgt gctggccaag 240
ccaaccaaga tccagatcga gaacacaaat atcgatatca gcccttggta caatccagac 300
cagaccttcc acatcctggg ccgcgacaca ctgtctaaga tgcgggccat cgtgagcttt 360
gagaagaacg gcgagatgac cgtgctgctg cctccaacat atcacaagca gctgtcctgt 420
cagaccaag 429
<210> 278
<211> 381
<212> DNA
<213> Gammaretrovirus feline leukemia virus
<400> 278
atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60
gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120
gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180
atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240
ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300
ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360
cctctgacca gctctctgta c 381
<210> 279
<211> 210
<212> DNA
<213> Gammaretrovirus feline leukemia virus
<400> 279
cctgtgctgc ctaagtccga tccccctaaa cctcctgttt tacctcccga ccctagcagc 60
ccactgatcg acctgctgac ggaagaacct cctccttatc ctggcggaca tggcccccca 120
ccttctggcc ctcggacccc aaccgcctcc cctatcgcct ctagactgag agagcggaga 180
gaaaaccccg ccgaagagtc ccaagccctg 210
<210> 280
<211> 744
<212> DNA
<213> Gammaretrovirus feline leukemia virus
<400> 280
cccctgagag agggccctaa caaccggcct cagtactggc ccttcagcgc cagcgatctg 60
tataactgga agtcccacaa tcctcctttc agccaggatc ctgtggccct gacaaacctg 120
atcgagtcta tcctggtgac tcaccagcca acctgggatg actgccagca gctgctgcag 180
gccctcctga ccggcgaaga gagacagaga gtgctgctgg aggccagaaa gcaggtgcct 240
ggagaggacg gcaggcctac ccagctgcct aatgtgatcg acgagacatt ccccctgacc 300
agaccaaatt gggacttcgc caccccagct ggcagagagc acctgcgcct gtaccggcag 360
cttctgctgg ccggactgag aggcgctgcc agaagaccaa ccaacctggc tcaggtgaag 420
caggtcgtgc agggcaaaga ggagacaccc gccgctttcc tggaacggct gaaggaggcc 480
tacagaatgt acacccctta cgaccccgaa gatccaggac aggccgccag cgtgatcctg 540
agcttcatct accagagcag ccctgacatc agaaacaagc tgcagcggct ggaaggcctg 600
cagggcttca cactgagcga cctgctcaag gaggccgaga agatctacaa caagcgggaa 660
acccctgagg aaagagaaga gagattgtgg cagcggcaag aggagcggga caaaaagcgg 720
cacaaggaaa tgaccaaggt gctg 744
<210> 281
<211> 171
<212> DNA
<213> Gammaretrovirus feline leukemia virus
<400> 281
gctaccgtgg tggcccagaa cagagataaa gacagagagg aatcgaagct gggcgaccag 60
agaaagatcc cccttggcaa ggaccaatgt gcctactgca aggaaaaagg ccactgggtg 120
agggactgtc ccaagagacc cagaaagaag cccgcaaaca gcacactgct g 171
<210> 282
<211> 375
<212> DNA
<213> Gammaretrovirus feline leukemia virus
<400> 282
aacctgggcg atcaggagag ccaaggccag gacccccctc ctgagcctag aatcaccctg 60
aagattggag gccagcctgt gacctttctg gtggacaccg gcgcccaaca ctctgtgctg 120
accagacctg atggccccct cagcgataga accgccctgg tccagggagc tacaggcagc 180
aagaactaca gatggaccac cgacagaagg gtgcagctgg ctactggcaa ggtgacacac 240
agctttctgt acgtgcccga gtgcccttac cccctcctgg gcagagatct gttgacaaag 300
ctgaaggccc aaatccactt caccggagag ggcgctaatg tggtgggccc caagggcctg 360
cctcttcagg tgctg 375
<210> 283
<211> 393
<212> DNA
<213> Gammaretrovirus Maloney murine leukemia virus
<400> 283
atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60
cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120
gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180
atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240
ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300
gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360
cctcggtcca ccccaccaag aagctccctg tat 393
<210> 284
<211> 252
<212> DNA
<213> Gammaretrovirus Maloney murine leukemia virus
<400> 284
cctgccctga caccatctct gggcgccaag ccaaagccac aggtgctgtc tgacagcgga 60
ggacctctga tcgacctgct gaccgaggat cctccaccct acagagatcc aaggcctcca 120
ccatccgaca gggatggaaa cggaggagag gcaacaccag caggagaggc ccctgaccca 180
tcccccatgg cctctagact gaggggcagg cgcgagcctc cagtggcaga tagcaccaca 240
tcccaggcat tc 252
<210> 285
<211> 789
<212> DNA
<213> Gammaretrovirus Maloney murine leukemia virus
<400> 285
ccactgaggg caggaggaaa tggccagctg cagtattggc ccttttctag ctccgacctg 60
tacaactgga agaacaataa cccatccttc tctgaggatc ccggcaagct gaccgccctg 120
atcgagagcg tgctgatcac ccaccagccc acatgggacg attgtcagca gctgctgggc 180
accctgctga caggcgagga gaagcagcgg gtgctgctgg aggcaaggaa ggccgtgaga 240
ggcgacgatg gcagacccac ccagctgcct aatgaggtgg acgcagcatt tccactggag 300
aggccagact gggattatac cacacaggcc ggcaggaacc acctggtgca ctacaggcag 360
ctgctgctgg ccggactgca gaatgcaggc aggtccccta ccaacctggc caaggtgaag 420
ggcatcacac agggccctaa tgagagccca tccgcctttc tggagcgcct gaaggaggcc 480
taccggagat atacccccta cgaccctgag gatccaggcc aggagacaaa cgtgtctatg 540
agcttcatct ggcagtctgc cccagacatc ggaaggaagc tggagcgcct ggaggacctg 600
aagaataaga ccctgggcga tctggtgcgg gaggcagaga agatcttcaa caagagagag 660
acacctgagg agagggagga gcggatcagg agggagaccg aggagaagga ggagcggaga 720
aggacagagg acgagcagaa ggagaaggag cgggatcgcc ggagacacag agagatgagc 780
aagctgctg 789
<210> 286
<211> 180
<212> DNA
<213> Gammaretrovirus Maloney murine leukemia virus
<400> 286
gccaccgtgg tgtccggaca gaagcaggac aggcagggag gagagaggcg ccggtctcag 60
ctggaccgcg atcagtgcgc ctactgtaag gagaagggcc actgggccaa ggattgcccc 120
aagaagccta gaggcccaag gggccctagg ccacagacca gcctgctgac actggacgat 180
<210> 287
<211> 378
<212> DNA
<213> Gammaretrovirus Maloney murine leukemia virus
<400> 287
acactggacg atcaaggagg acagggacag gagccacctc cagagcccag aatcaccctg 60
aaggtcggcg gccagcctgt gacctttctg gtggacacag gcgcccagca cagcgtgctg 120
acccagaatc ccggccctct gtctgataag agcgcctggg tgcagggagc aacaggcggc 180
aagcggtaca gatggaccac agaccggaag gtgcacctgg ccaccggcaa ggtgacacac 240
agctttctgc acgtgcccga ctgtccatac cccctgctgg gcagagatct gctgaccaag 300
ctgaaggcac agatccactt cgagggatcc ggagcacagg tcatgggacc aatgggacag 360
cctctgcagg tgctgaca 378
<210> 288
<211> 459
<212> DNA
<213> Lentivirus Caprine Arthritis Encephalitis Virus
<400> 288
atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60
gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120
ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180
aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240
acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300
atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360
atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420
agcgtgtttc caatcgtggt gcaggcagca ggaggccgg 459
<210> 289
<211> 636
<212> DNA
<213> Lentivirus Caprine Arthritis Encephalitis Virus
<400> 289
tcctggaagg ccgtggactc tgtgatgttc cagcagctgc agaccgtggc aatgcagcac 60
ggactggtga gcgaggattt tgagagacag ctggcctact atgccaccac atggacatcc 120
aaggacatcc tggaggtgct ggccatgatg cccggcaaca gagcccagaa ggagctgatc 180
cagggcaagc tgaatgagga ggccgagagg tggcggagaa acaatccacc tccaccagca 240
ggaggaggac tgaccgtgga tcagatcatg ggagtgggac agacaaacca ggcagcagca 300
caggcaaata tggaccaggc cagacagatc tgcctgcagt gggtcatcaa cgcactgagg 360
gccgtgagac acatggcaca caggcccggc aaccctatgc tggtgaagca gaagaccaat 420
gagccttacg aggacttcgc cgccagactg ctggaggcca tcgatgccga gccagtgaca 480
cagcccatca aggactacct gaagctgacc ctgagctata caaatgcctc cgccgactgc 540
cagaagcaga tggatagaac cctgggacag agggtgcagc aggcctccgt ggaggagaag 600
atgcaggcct gtagggatgt gggctctgag ggcttt 636
<210> 290
<211> 249
<212> DNA
<213> Lentivirus Caprine Arthritis Encephalitis Virus
<400> 290
aagatgcagc tgctggccca ggccctgagg cctggcaagg gcaagggaaa cggacagcca 60
cagcggtgct acaattgtgg caagccagga caccaggcaa ggcagtgcag gcagggcatc 120
atatgtcaca actgtggaaa gagaggacat atgcaaaaag aatgcagagg aaagagagac 180
ataaggggaa aacagcaggg aaacgggagg agggggatac gtgtggtgcc gtccgctcct 240
cctatggaa 249
<210> 291
<211> 477
<212> DNA
<213> Lentivirus Caprine Arthritis Encephalitis Virus
<400> 291
atgtcacaac tgtggaaaga gaggacatat gcaaaaagaa tgcagaggaa agagagacat 60
aaggggaaaa cagcagggaa acgggaggag ggggatacgt gtggtgccgt ccgctcctcc 120
tatggaataa caagcgcccc tccaatggtg caggtgcgga ttggatctca gcagcgcaac 180
ctgctgttcg acaccggcgc cgatagaacc atcgtccggt ggcacgaggg ctccggcaac 240
cccgccggca gaatcaaact gcaaggcatc ggcggaatcg tggaaggcga gaagtggaac 300
aacgtggagc tggaatacaa gggcgagaca agaaagggca ccatcgtggt gctgcctcag 360
agccctgtgg aggtgctggg acgggacaac atggcccggt tcggcatcaa gatcatcatg 420
gctaatctgg aggaaaaaag aatccccatc accaaggtga agttgaaaga gggatgt 477
<210> 292
<211> 39
<212> DNA
<213> Lentivirus Caprine Arthritis Encephalitis Virus
<400> 292
ggtgccgcag gaggccggtc ctggaaggcc ggcggcagc 39
<210> 293
<211> 372
<212> DNA
<213> Lentivirus equine infectious anemia virus
<400> 293
atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60
ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120
cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180
gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240
gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300
tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360
agcgaggagt at 372
<210> 294
<211> 690
<212> DNA
<213> Lentivirus equine infectious anemia virus
<400> 294
ccaatcatga tcgacggcgc cggcaaccgg aatttcagac cactgacccc cagaggctac 60
accacatggg tgaacacaat ccagaccaac ggcctgctga atgaggcctc ccagaatctg 120
ttcggcatcc tgagcgtgga ttgtacctcc gaggagatga atgcctttct ggacgtggtg 180
ccaggacagg caggacagaa gcagatcctg ctggacgcca tcgataagat cgccgacgat 240
tgggataacc ggcacccact gcccaatgca cctctggtgg caccacctca gggacctatc 300
ccaatgacag ccaggtttat caggggactg ggagtgccac gggagagaca gatggagccc 360
gccttcgacc agtttaggca gacctaccgc cagtggatca tcgaggccat gagcgagggc 420
atcaaagtga tgatcggcaa gccaaaggca cagaacatca ggcagggagc caaggagccc 480
tatcctgagt tcgtggatag actgctgtcc cagatcaagt ctgagggcca ccctcaggag 540
atctccaagt ttctgaccga cacactgacc atccagaacg ccaatgagga gtgccggaat 600
gccatgcggc acctgagacc agaggatacc ctggaggaga agatgtacgc ctgtagagac 660
atcggcacca caaagcagaa gatgatgctg 690
<210> 295
<211> 453
<212> DNA
<213> Lentivirus equine infectious anemia virus
<400> 295
ctggccaagg ccctgcagac aggcctggcc ggaccattca agggaggcgc cctgaagggc 60
ggccccctga aggccgccca gacctgctat aactgtggca agccaggaca cctgagctcc 120
cagtgcaggg caccaaaggt gtgcttcaag tgtaagcagc ctggccactt ttctaagcaa 180
tgcagaagtg ttccaaaaaa cgggaagcaa ggggctcaag ggaggcccca gaaacaaact 240
ttcccgatac aacagaagag tcagcacaac aaatctgttg tacaagagac tcctcagact 300
caaaatctgt acccagatct gagcgaaata aaaaaggaat acaatgtcaa ggagaaggat 360
caagtagagg atctcaacct ggacagtttg tgggagtaaa catataacct ggagaagcgc 420
cccaccacaa tcgtgctgat caacgacacc cct 453
<210> 296
<211> 243
<212> DNA
<213> Lentivirus equine infectious anemia virus
<400> 296
ctgaacgtgc tgctggacac aggagctgat acatctgtgc tcaccaccgc ccactacaac 60
cggctgaagt acagaggcag aaagtaccag ggcaccggca tcatcggcgt gggcggaaat 120
gtggaaacct tcagcacccc agtgaccatt aagaaaaagg gccggcacat caaaaccaga 180
atgctggtcg ccgacatccc tgtgacaatc ctgggcagag atatccttca ggacttaggt 240
gca 243
<210> 297
<211> 39
<212> DNA
<213> Lentivirus equine infectious anemia virus
<400> 297
ggtgccagcg aggagtatcc aatcatgatc ggcggcagc 39
<210> 298
<211> 405
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 298
atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60
ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120
ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180
ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240
acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300
aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360
accagccgcc caacagcacc accttccgga aggggcggca actac 405
<210> 299
<211> 690
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 299
cccgtgcagc aagtgggcgg caattatgtg cacctgcccc tgagccctag aaccctgaac 60
gcctgggtga agctggtgga ggagaagaag ttcggagcag aggtggtgcc aggatttcag 120
gccctgtccg agggctgcac accctacgac atcaaccaga tgctgaattg cgtgggagag 180
caccaggcag caatgcagat catccgggag atcatcaacg aggaggcagc agactgggat 240
ctgcagcacc ctcagccagg accactgcct gcaggacagc tgcgggagcc tagaggctct 300
gacatcgccg gcaccacaag caccgtggat gagcagatcc agtggatgta caggcagcag 360
aacccaatcc ccgtgggcaa tatctatcgg agatggatcc agctgggcct gcagaagtgc 420
gtgcggatgt ataacccaac caatatcctg gacgtgaagc agggcccaaa ggagcccttc 480
cagagctacg tggacagatt ctacaagtcc ctgagagccg agcagacaga tcccgccgtg 540
aagaactgga tgacccagac actgctgatc cagaacgcca atcccgattg caagctggtg 600
ctgaagggcc tgggcatgaa tcctaccctg gaggagatgc tgacagcatg tcagggagtg 660
ggaggacctg gacagaaggc aaggctgatg 690
<210> 300
<211> 426
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 300
gcagaggccc tgaaggaggc cctgaggcct gaccagctgc catttgccgc cgtgcagcag 60
aagggccaga ggaagaccat caagtgctgg aactgtggca aggagggaca ctctgccaag 120
cagtgcaggg caccaaggcg ccagggatgc tggaagtgtg gcaagacagg ccacgtgatg 180
gccaagtgtc ctgagaggca ggcaggcttc ctgggactgg gaccatgggg caagaagcca 240
agaaattttc ctatggccca gatgcctcag ggactgatcc caaccgcacc accagaggac 300
ccagcagtgg atctgctgaa gaactacatg aagatgggca ggaagcagcg cgagaatagg 360
gagcgccctt ataaggaggt gacagaggac ctgctgcacc tgaactctct ctttggagaa 420
gaccag 426
<210> 301
<211> 306
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 301
tctctttgga gaagaccagt agttacagcc tacatcgagg aacagcctgt ggaagtgctg 60
ctggatacag gagctgatga cagcatcgtg gccggcattg agctgggacc taactacacc 120
ccaaagatcg tgggcggcat cggcggattc atcaatacca aagagtacaa ggacgtgaag 180
atcaaagtgc tgggcaaggt gatcaagggc accatcatga ccggcgacac acccatcaac 240
atcttcggca gaaacctgct caccgccatg ggcatgtctc tgaacctgcc tatcgccaag 300
gtcgag 306
<210> 302
<211> 39
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 302
ggtgccggcg gcaactaccc cgtgcagcaa ggcggcagc 39
<210> 303
<211> 405
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 303
atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60
ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120
ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180
ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240
actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300
aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360
acaagcagac caacagcacc acctagtggc agaggaggaa attac 405
<210> 304
<211> 690
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 304
ccagtgcagc aagtaggtgg caattatgtc cacctaccct taagtccaag aacattaaat 60
gcttgggtaa aattagtaga agagaaaaaa tttggggcag aggtagtgcc aggatttcaa 120
gcgctatcag aaggctgcac tccctatgat attaatcaaa tgctaaattg tgtaggagaa 180
catcaggcag ccatgcaaat tattagagag attataaatg aagaagctgc cgattgggat 240
ttacaacacc cgcaaccagg tccactacca gcagggcaac ttagagagcc aagaggatca 300
gacattgcag gaactactag tacagtagat gaacaaatcc aatggatgta caggcaacaa 360
aaccccatac cagtaggcaa catttataga aggtggatcc aattagggct gcagaaatgt 420
gtaagaatgt ataacccaac aaacatttta gatgtgaaac aaggaccaaa agagccattt 480
caaagctacg tagatagatt ctacaaaagt ctaagagcag agcaaacaga tcccgcagta 540
aagaattgga tgacccaaac actgctgatt caaaatgcta acccagattg taaactagtg 600
ctcaagggtc tgggcatgaa tcccacttta gaagaaatgc tgacagcctg tcagggagta 660
ggagggccag gacaaaaagc taggttaatg 690
<210> 305
<211> 426
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 305
gcagaagcat tgaaagaggc actgaggcca gatcaactcc catttgcagc agtccaacag 60
aaaggacaaa ggaagacaat caagtgttgg aattgtggaa aggagggaca ctctgcaaaa 120
caatgcaggg cccctagaag acagggctgc tggaagtgtg gaaaaacggg tcatgttatg 180
gccaaatgcc ctgaaagaca ggcgggtttt ttagggcttg gcccatgggg aaagaagccc 240
cgcaatttcc ccatggccca gatgcctcag gggctgatac caactgctcc cccagaggat 300
ccagctgtgg atctactgaa gaattacatg aagatgggca gaaagcagag ggagaacaga 360
gagagacctt acaaggaggt gacagaggat ttgctgcacc tcaattctct ctttggagaa 420
gaccag 426
<210> 306
<211> 288
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 306
tctctttgga gaagaccagt agtcactgcc tacattgaag aacagcccgt agaagtatta 60
ttagatacag gggctgacga ttcaattgta gcagggatag aattgggtcc aaattatacc 120
cctaaaatag taggaggaat aggaggcttc attaacacca aagaatataa agatgtaaaa 180
ataaaagtct taggcaaggt aattaaggga acaattatga cgggagatac cccaattaat 240
atttttggca gaaatttgct aacagctatg ggcatgtctt taaatctc 288
<210> 307
<211> 57
<212> DNA
<213> Lentivirus Simian immunodeficiency virus
<400> 307
cccatagcta aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagc 57
<210> 308
<211> 429
<212> DNA
<213> Lentivirus visna maedi virus
<400> 308
atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60
gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120
tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180
acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240
agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300
aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360
aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420
gaggtgtat 429
<210> 309
<211> 660
<212> DNA
<213> Lentivirus visna maedi virus
<400> 309
ccaatcgtga atctgcaggc aggaggccgc agctggaagg cagtggagtc cgtggtgttc 60
cagcagctgc agaccgtggc catgcagcac ggcctggtgt ctgaggactt tgagcggcag 120
ctggcctact atgccaccac atggacaagc aaggatatcc tggaggtgct ggccatgatg 180
ccaggcaaca gagcccagaa ggagctgatc cagggcaagc tgaatgagga ggcagagcgg 240
tgggtgagac agaacccacc tggacccaat gtgctgaccg tggaccagat catgggcgtg 300
ggccagacaa accagcaggc cagccaggcc aatatggatc aggccaggca gatctgcctg 360
cagtgggtca tcaccgccct gaggagcgtg cgccacatgt cccacaggcc tggaaaccca 420
atgctggtga agcagaagaa tacagagtcc tacgaggact tcatcgccag gctgctggag 480
gcaatcgacg cagagcccgt gacagatcct atcaagacct acctgaaggt gaccctgtct 540
tatacaaacg ccagcaccga ctgccagaag cagatggata ggaccctggg aacacgcgtg 600
cagcaggcaa ccgtggagga gaagatgcag gcctgtcggg atgtgggctc tgagggcttt 660
<210> 310
<211> 237
<212> DNA
<213> Lentivirus visna maedi virus
<400> 310
aagatgcagc tgctggccca ggccctgaga cctcagggca aggcaggaca gaagggagtg 60
aaccagaagt gctacaattg tggcaagcca ggacacctgg caaggcagtg cagacaggga 120
atcatctgcc accactgtgg caagaggggc cacatgcaga aggactgtcg ccagaagaag 180
cagcagggca acaataggag aggaccaagg gtggtgccat ctgccccacc aatgctg 237
<210> 311
<211> 312
<212> DNA
<213> Lentivirus visna maedi virus
<400> 311
gtgacagagg cccctcctaa gatcgagatc aaggtgggca caagatggaa gaaactgctg 60
gtcgacaccg gcgctgataa gaccatcgtg accagccacg acatgagcgg catccccaag 120
ggcagaatca tcctgcaggg cattggagga atcatcgagg gcgagaagtg ggagcaggtg 180
cacctgcagt acaaggacaa gatcatccgg ggcaccatcg tggtgctcgc cacatctcca 240
gtggaagtgc tgggaagaga taacatgcgg gaactgggca tcggcctgat catggctaac 300
ctggaagaga aa 312
<210> 312
<211> 39
<212> DNA
<213> Lentivirus visna maedi virus
<400> 312
ggtgccaggg aggtgtatcc aatcgtgaat ggcggcagc 39
<210> 313
<211> 1632
<212> DNA
<213> Bovispumavirus bovine foamy virus
<400> 313
atggccctga atgatttcga ccctatcgcc ctccagggct acctgccggc ccctagagtg 60
ctgcaacaca acgacatcat catctgcaga gctacttctg gcccctgggg catcggcgac 120
agatacaacc tgatcaggat ccacctgcaa gaccctgccg gacagcccct tccaatcccc 180
cagtgggagc ctatccctaa ccggaccgcc aacccccgga cacagcccta ccctgtggtg 240
tctgccccaa tggctaccct ggaaaacatc ctgaacaact ttcacatccc ccacggcgtg 300
tccagatacg gccccctgga aggcggagat taccagcctg gcgaacagta cagccaaggc 360
ttctgccctg tgacccaggc cgagattgcc ctgctgaacg gccagcacct ggaagaagag 420
atcacaatcc tgagagagat cacccacaga ctgatgcagg gcgtgcggcc tcctgccgtg 480
cctcagggcc ctgctcctcc tcctcctcca gctcagcctc ctgctcccct gcctgctcca 540
ccaattgggc ctccacctcc cgctgcccct gcccccgccc caggccccat gcctgtgccc 600
cagcatctgc ctattacaca tatcagagcc gtgatcggcg aaacccccgc caacatccgc 660
gaggtgccac tgtggctggc tagagccgtt cccgccctgc agggagtgta ccccgtccag 720
gacgccgtga tgagaagccg caccgtgaac gccctgaccg tgcggcaccc tggactggcc 780
ctggaacctc tggagtgcgg cagctggcaa gagtgtctgg ccgccctgtg gcagagaacc 840
ttcggcgcca ccgccctgca cgccctgggc gataccctgg gtcagatcgc aaacagcgac 900
ggcatcgtga tggctatcga gctgggcctg ctcttttccg atgataactg ggacctggtg 960
tggggaatct gtagaagatt cctgcccggc caggccgtct gcgtggccgt gcaggccaga 1020
ctggatcccc tgcccgacaa cgctacaaga atcgtgatga tcagccacat catccgggac 1080
gtgtacgcca tcctgggcct ggaccctctg ggcagaccca tgcagcagac actgcctaga 1140
cggaacaacc agcctcccag acagcagcca cagagacggc agcagcctag aagaaccggc 1200
aaccaggagg aaagaggcca gcggaaccgg ggccggcaga acgcccagac ccctcggcag 1260
gagggcaaca gactgcagaa cagccagctg cctggccctc gcgactgccc caacaatagc 1320
aaccagcctc ggtaccctct gcggccaaac ccccagcagc cccaaagata cggccaggag 1380
cagaatcgtg gcaacaatcc caacccttac agacaaccta cccctggcaa tggaaatcaa 1440
aacagaaact tcagccgggg gcctgcccca gtcaatgagc agagcagagg cagaggaaga 1500
tctagccagg gtacaaataa caccggctcc tctgctgtgc acagcgtgcg gctgaccagc 1560
gccgcccctc ctataccccc acaagatgcc ggcactccgc ccacttcaag tggaaatcaa 1620
gggcaatcat ct 1632
<210> 314
<211> 438
<212> DNA
<213> Bovispumavirus bovine foamy virus
<400> 314
atgccggcac tccgcccact tcaagtggaa atcaagggca atcatcttaa aggctactgg 60
gacagcggcg ccgagatcac atgcgtgccc gctatctaca tcatcgagga acaacctgtt 120
ggcaagaagc tgattacaac catccacaac gagaaggaac atgatgtgta ctacgtggaa 180
atgaaaatcg agaagcggaa ggtgcagtgt gaagtgatcg ccaccgccct ggattacgtg 240
ctggtggccc ctgtggacat cccctggtat aagcctggac ctctggaact gaccatcaag 300
atcgacgtcg agagccagaa gcacaccctg atcacagagt ccaccctctc tccacagggc 360
cagatgagac tgaagaaact gctggaccag taccaggccc tgtggcagtg ctgggagaac 420
caggtgggcc acagaaga 438
<210> 315
<211> 39
<212> DNA
<213> Bovispumavirus bovine foamy virus
<400> 315
ggtgcctctg ctgtgcacag cgtgcggctg ggcggcagc 39
<210> 316
<211> 1929
<212> DNA
<213> Prosimiispumavirus Brown greater galago prosimian foamy virus
<400> 316
atgtctcagc cctcggcttc cggttcagct ggcgctggtg gagctcctca gcagccccct 60
ccaccgccac ctcagcccgg cccagcggct ccagtgccac gagcacaaat tggttatggt 120
gacctggacg tacttttatt acaacaggaa tatcatttga tagatccaaa tttacaggta 180
caacacttag acactttatt agttagaatc acaggaggca actggggacc aggtgaccga 240
tttgctcgta ttgaggttct tcttagggac accctaggac cactccaaca acccaggtat 300
aggtatgcag caatgcagca agcagatctc aggaatgaca tcatcctgca tctaaattat 360
caagatgcaa ttataatttt tgatatgata ataccatctg aaggagttca taggcatgga 420
cccatgttcg atggactttg gattcatgga gatgattact ccatgaactt tcagccaatt 480
acagcacatg aactgtatct tttgccacag caagttctca cagaagaagt ggaactgctg 540
acggaagtgt gcaaccgaat ggcagactgg ataagacggc atcgctgtgg aggaggaagt 600
ggaagctcac aacccccgcc gccgcctcca cccgctgtgc ctgtcttgcc ttcagcacct 660
ccggctagca gtttaccctt accaccacaa ggatggggaa tctccccacc agtagccaca 720
tccactccag gagcggcagg acatagctcc agtgccggcc ctaatatttc ccttggtgga 780
acatatgttc ctccaccggt agcaccacca gctccggtga tagggggacc cggaggtccc 840
ggacagttgc cagcaatggt gcaagtcctc cccgctcagc cagtagtaat tcccatcaat 900
gttatccgaa gtgtttgtgg agatactcca tcaaacccac aggatattcc attgtggatg 960
ggaagaatta ttccagccat tgagggtgtg tttcctattg ataatccaaa tctacgaatg 1020
agagttgtga atgccctgct tgccctacat ccgggcttag caataacaga acttaatgcc 1080
cagacttggg gacaagtctt ggctgtgctc catatgcgag ccttgggaca cacagccctc 1140
catcagcttc ctgcactctt ggagactatt gtcaagacag atggcatatt gccagcatat 1200
aatatgggta tggaagtaac tcaacaagac ttttcatacg tatggggaat tttaagaaca 1260
ctacttccgg gacaagcatt tgtcctaagt atgcaaaatg aattagatag attacctgcg 1320
gctcagagac cgggaatgtt tcccggccta ctgcagagga ctctggacat actagggtta 1380
aattctcggg gacaaaatat tcaaaaaacc aatactcagc aacaagctcc aaaaaggggt 1440
cagaaaccga aacctcgact tcctcctgtg cataggcgac ccgcaccatt tacaccacct 1500
gctaccccta gcccgcgaca acaagcttct gcttcccctt cttcgcaggg cgataaccga 1560
agtcctcaac cccaagggcg tggtacttac ggaccgtcca gaggaggagg cagtgggccc 1620
agatataact tcaggccccg agtgcaacca cctgatcgat acggctttgg aaggggacaa 1680
gggggtcgca gttcaatagg tgctcaagat aatcaacagc ctggtcaagg aggacaacgc 1740
actcaacaaa caaaccaaaa ccgaaaccaa ggcaacgcca cgggaggaag aactcaacct 1800
caaaatcgca ctgtgaatac tgtgcgtgtc acacagacta acccccaagg aggaagttca 1860
gtgtcaaacc cagctgtgac aacttctcag aatacaggaa caggaagtgc aactcagagc 1920
tcatcatct 1929
<210> 317
<211> 429
<212> DNA
<213> Prosimiispumavirus Brown greater galago prosimian foamy virus
<400> 317
caacttctca gaatacagga acaggaagtg caactcagag ctcatcatct taaaggcttt 60
gtggacacag gcagcagcat cacctgcttc cccaagtaca ccctggtcga ggaagatcct 120
atcggccagt acgacatcag caccatccac ggcacagtgt cccagcctgt gtactacatc 180
aagttcaagg tgaacggcaa gaaagtggaa gccgaggtga ccgagtctcc actggactac 240
gtgatcctgt gtcctagcga cgtgccctgg ctgtctacaa agctggaact gacaattaag 300
ctgcctctgc accagcagca acaggagctg ctgagcaaga ccagagtgaa tcaaaaacag 360
ctgcagaaac tctttatcca gtatgatgac ctgtggcaga agtgggagaa ccaggttgga 420
caccggaag 429
<210> 318
<211> 39
<212> DNA
<213> Prosimiispumavirus Brown greater galago prosimian foamy virus
<400> 318
ggtgccagaa cagtgaacac cgtgcgggtg ggcggcagc 39
<210> 319
<211> 1944
<212> DNA
<213> Betacarmovirus Cardamine chlorotic fleck virus
<400> 319
atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60
ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120
accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180
gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240
cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300
gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360
gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420
gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480
ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540
atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600
agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660
cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720
tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780
gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840
gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900
gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960
ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020
gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080
ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140
cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200
caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260
ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320
cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380
aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440
acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500
cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560
ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620
ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680
accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740
gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800
ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860
aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920
gcttccagcg gagatcaaag gaac 1944
<210> 320
<211> 447
<212> DNA
<213> Betacarmovirus Cardamine chlorotic fleck virus
<400> 320
atgaatcctc ttcagctgtt gcaaccgctt ccagcggaga tcaaaggaac taaactgtta 60
gcccattggg acagcggcgc caccattaca tgcgtgcccg agtccttcct ggaagatgag 120
cagcctatca aacagaccct gatcaagaca atccacggcg agaagcagca gaaagtgtac 180
tacctgacct ttaagatcaa gggaagaaag gtggaagctg aagtgatcgc cagcccttac 240
gagtacatcc tgctgtctcc aacagacgtg ccttggctga cacagcaacc tctgcagctg 300
accatcctgg tccccctgca ggagtatcag gatagaatcc tcaacaagac cgccctgcct 360
gaggaacaga agcaaagact gaagaccctg ttcgccaagt acgacaccct gtggcagcac 420
tgggagaacc aggtgggcca ccggcgg 447
<210> 321
<211> 39
<212> DNA
<213> Betacarmovirus Cardamine chlorotic fleck virus
<400> 321
ggtgccagag ccgtcaacac agtgacccag ggcggcagc 39
<210> 322
<211> 1677
<212> DNA
<213> Equispumavirus equine foamy virus
<400> 322
atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60
atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120
gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180
cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240
tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300
cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360
cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420
gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480
atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540
cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600
cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660
cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720
tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780
gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840
tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900
ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960
ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020
cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080
gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140
ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200
gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260
agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320
cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380
agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440
tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500
caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560
agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620
ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagcct 1677
<210> 323
<211> 438
<212> DNA
<213> Equispumavirus equine foamy virus
<400> 323
atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa gggattttat 60
gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga agagcctatc 120
ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta ctacctgacc 180
tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct ggactacgtg 240
atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact gacaattaaa 300
atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc tagcgaggga 360
aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa gtgggaaaac 420
caggtcggcc acagaaga 438
<210> 324
<211> 48
<212> DNA
<213> Equispumavirus equine foamy virus
<400> 324
ggtgccaaca ccgtgcacac cgtgcggcaa gtggaatctg gcggcagc 48
<210> 325
<211> 1542
<212> DNA
<213> Felispumavirus feline foamy virus
<400> 325
atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60
cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120
ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180
gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240
ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300
cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360
cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420
gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480
atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540
ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600
agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660
gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720
agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780
gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840
ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900
ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960
attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020
aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080
cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140
aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200
gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260
aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320
ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380
ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440
ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500
tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag at 1542
<210> 326
<211> 438
<212> DNA
<213> Felispumavirus feline foamy virus
<400> 326
atggatctgc tgaagccgtt gacggtggaa agaaaggggg taaagattaa aggttactgg 60
gattctcagg ccgacatcac ctgcgtgcca aaggacctgc tgcagggcga ggaacccgtg 120
cggcagcaga atgtgaccac catccacggc acccaggagg gcgatgtcta ctacgtgaac 180
ctgaagatcg acggcagaag aatcaacacc gaggtgatcg gcacaacact ggactatgct 240
atcatcaccc ctggcgacgt gccttggatc ctgaagaaac ctctggaact gacaattaag 300
ctggatctgg aagagcaaca aggaaccctg ctcaacaaca gcatcctgag caagaagggc 360
aaggaagagc tgaaacagct gttcgagaag tactccgccc tgtggcagag ctgggagaac 420
caggtgggac acagacgg 438
<210> 327
<211> 39
<212> DNA
<213> Felispumavirus feline foamy virus
<400> 327
ggtgccgccg ccgtgcacac cgtgaaagcc ggcggcagc 39
<210> 328
<211> 1941
<212> DNA
<213> Simiispumavirus Rhesus macaque simian foamy virus
<400> 328
atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60
ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120
tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180
cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240
accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300
gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360
ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420
aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480
gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540
gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600
ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660
tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720
aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780
cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840
cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900
agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960
aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020
atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080
tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140
ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200
ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260
cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320
gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380
gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440
gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500
ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560
agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620
agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680
cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740
agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800
aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860
gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920
ggaagcggaa atcaagggaa c 1941
<210> 329
<211> 447
<212> DNA
<213> Simiispumavirus Rhesus macaque simian foamy virus
<400> 329
atggatcctc tccagctcct ccagcctctg gaagcggaaa tcaagggaac taaattaaaa 60
gcccactggg acagcggagc caccattaca tgcatccccg aggcttttct ggaagatgag 120
cagcctatcc aaacaatgct gatcaagacc atccacggcg agaagcagca gaacgtgtac 180
tacctgacat tcaagatcca gggcagaaag gtggaagccg aggtgctggc ctctccttat 240
gactacatcc tgctcaatcc ttctgatgtg ccatggctga tgaaaaagcc tctgcaactg 300
accgtgctgg tccccctgca ggactaccag gagcggctgc tgaaacagac caccctgcct 360
aaggaacaga aggaccagct ggaaaagctg ttcctgaagt acgacgccct gtggcagcac 420
tgggagaacc aggtgggcca cagaaga 447
<210> 330
<211> 39
<212> DNA
<213> Simiispumavirus Rhesus macaque simian foamy virus
<400> 330
ggtgccagaa cagtgaacac cgtgacaacc ggcggcagc 39
<210> 331
<211> 1941
<212> DNA
<213> Spumavirus Simian foamy virus
<400> 331
atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60
ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120
tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180
cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240
accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300
ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360
ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420
gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480
gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540
gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600
ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660
tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720
aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780
cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840
cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900
agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960
aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020
atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080
tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140
ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200
ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260
cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320
gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380
gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440
ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500
caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560
ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620
cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680
cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740
cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800
aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860
accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920
ggaagcggaa atcaagggaa c 1941
<210> 332
<211> 447
<212> DNA
<213> Spumavirus Simian foamy virus
<400> 332
atggatcctc tacaactcct ccagcctctg gaagcggaaa tcaagggaac taaattaaaa 60
gcccactggg atagcggagc tacaatcacc tgcgtgcccg aggcctttct ggaagatgag 120
agacctatcc agaccatgct gatcaagacc atccacggcg agaagcagca ggacgtctac 180
tacctgacct tcaaggtgca gggcagaaag gtggaagccg aggtgctggc ctctccttat 240
gactacatcc tgctcaaccc cagcgacgtg ccttggctga tgaaaaagcc tctgcagctg 300
acagtgctgg tgccactgca cgagtaccag gagcggctgc tgcaacaaac cgccctgcct 360
aaggaacaga aagagctgct gcagaagctg ttcctgaagt acgacgccct gtggcagcat 420
tgggaaaacc aggtgggcca ccggaga 447
<210> 333
<211> 39
<212> DNA
<213> Spumavirus Simian foamy virus
<400> 333
ggtgccagat ccgtgaacac cgtgacagcc ggcggcagc 39
<210> 334
<211> 396
<212> DNA
<213> Lentivirus human immunodeficiency virus
<400> 334
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattac 396
<210> 335
<211> 693
<212> DNA
<213> Lentivirus human immunodeficiency virus
<400> 335
cctatagtgc agaacatcca ggggcaaatg gtacatcagg ccatatcacc tagaacttta 60
aatgcatggg taaaagtagt agaagagaag gctttcagcc cagaagtgat acccatgttt 120
tcagcattat cagaaggagc caccccacaa gatttaaaca ccatgctaaa cacagtgggg 180
ggacatcaag cagccatgca aatgttaaaa gagaccatca atgaggaagc tgcagaatgg 240
gatagagtgc atccagtgca tgcagggcct attgcaccag gccagatgag agaaccaagg 300
ggaagtgaca tagcaggaac tactagtacc cttcaggaac aaataggatg gatgacacat 360
aatccaccta tcccagtagg agaaatctat aaaagatgga taatcctggg attaaataaa 420
atagtaagaa tgtatagccc taccagcatt ctggacataa gacaaggacc aaaggaaccc 480
tttagagact atgtagaccg attctataaa actctaagag ccgagcaagc ttcacaagag 540
gtaaaaaatt ggatgacaga aaccttgttg gtccaaaatg cgaacccaga ttgtaagact 600
attttaaaag cattgggacc aggagcgaca ctagaagaaa tgatgacagc atgtcaggga 660
gtggggggac ccggccataa agcaagagtt ttg 693
<210> 336
<211> 42
<212> DNA
<213> Lentivirus human immunodeficiency virus
<400> 336
gctgaagcaa tgagccaagt aacaaatcca gctaccataa tg 42
<210> 337
<211> 164
<212> DNA
<213> Lentivirus human immunodeficiency virus
<400> 337
atacagaaag gcaattttag gaaccaaaga aagactgtta agtgtttcaa ttgtggcaaa 60
gaagggcaca tagccaaaaa ttgcagggcc cctaggaaaa agggctgttg gaaatgtgga 120
aaggaaggac accaaatgaa agattgtact gagagacagg ctaa 164
<210> 338
<211> 204
<212> DNA
<213> Lentivirus human immunodeficiency virus
<400> 338
tttttaggga agatctggcc ttcccacaag ggaaggccag ggaattttct tcagagcaga 60
ccagagccaa cagccccacc agaagagagc ttcaggtttg gggaagagac aacaactccc 120
tctcagaagc aggagccgat agacaaggaa ctgtatcctt tagcttccct cagatcactc 180
tttggcagcg acccctcgtc acaa 204
<210> 339
<211> 297
<212> DNA
<213> Lentivirus human immunodeficiency virus
<400> 339
cctcagatca ctctttggca gcgacccctc gtcacaataa agataggggg gcaattaaag 60
gaagctctat tagatacagg agcagatgat acagtattag aagaaatgaa tttgccagga 120
agatggaaac caaaaatgat agggggaatt ggaggtttta tcaaagtaag acagtatgat 180
cagatactca tagaaatctg cggacataaa gctataggta cagtattagt aggacctaca 240
cctgtcaaca taattggaag aaatctgttg actcagattg gctgcacttt aaatttt 297
<210> 340
<211> 3123
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 119 variant
<400> 340
atggctccga agaagaagcg aaaggtcagc caggaaatta aacgcatcaa caagatccgc 60
cgtcgtctgg taaaagacag caatacgaaa aaagccggaa aaaccggtcc gatgaaaacg 120
ctgctggtgc gcgtgatgac gccggatctc cgcgaacgtc ttgagaattt gcgtaagaaa 180
cctgaaaata ttccgcaacc gatttctaac acctcgcgcg ccaatctgaa taaactgctg 240
accgattaca ccgaaatgaa gaaagcgatt ctgcacgttt actgggaaga gttccagaaa 300
gacccggtcg gtctgatgag ccgcgttgcg caacctgcgc cgaaaaatat cgatcagcgc 360
aagttaatcc cggttaaaga tggtaatgaa cgtttaacct ccagcggctt tgcctgcagt 420
cagtgctgcc agccacttta tgtttataaa cttgaacagg ttaacgataa agggaaaccc 480
cataccaatt atttcggccg ctgcaatgtc agcgaacatg aacgcctgat tttgttaagc 540
ccgcataaac cggaagcgaa tgacgaactg gtgacctatt ccctgggtaa atttggtcag 600
cgggcgctgg atttttacag cattcatgtg acgcgggaaa gtaaccatcc ggtaaagcca 660
ctggaacaaa tcggcggtaa cagctgcgcc tctggcccgg ttggcaaagc gcttagcgat 720
gcctgtatgg gcgcggtggc gagctttctg acaaaatacc aggatattat cctggagcat 780
cagaaggtga tcaaaaagaa cgagaaacgt ctggcaaatt taaaggatat tgcctccgct 840
aacggcctgg cgttcccgaa gattacctta ccgccgcagc cgcacaccaa agaaggtatc 900
gaagcgtata acaacgttgt tgcccagatc gtcatctggg tgaatctcaa cctgtggcaa 960
aaactgaaaa ttggtcgtga tgaagcaaaa ccgttgcagc gactgaaagg attcccgtcg 1020
tttccgctgg ttgaacgaca ggcgaacgaa gtggattggt gggatatggt ttgtaacgtc 1080
aaaaaattga tcaacgaaaa aaaggaagat ggcaaagttt tctggcaaaa tctggcgggt 1140
tacaaacgtc aggaggcgtt gcgtccgtat ctctcttcag aagaagatcg caaaaaaggc 1200
aagaagtttg ctcgctatca gtttggcgat ttattactgc atctggaaaa aaaacacggc 1260
gaagactggg gcaaagtgta cgatgaagcc tgggagcgta tcgacaaaaa agtggaaggt 1320
ttgtcgaaac atattaaact cgaagaagag cgccgcagtg aagatgcgca gtcaaaagca 1380
gcgctgacgg actggttacg tgcgaaagcc agttttgtga ttgaaggatt aaaagaagct 1440
gataaagatg aattttgccg ttgcgaactg aaactgcaaa aatggtatgg cgacctgcgc 1500
ggcaaaccgt tcgccattga ggcagaaaat agcatccttg atatctccgg tttcagcaaa 1560
caatataact gcgcgtttat ttggcagaaa gacggcgtga aaaagcttaa cctgtatctg 1620
atcattaact attttaaagg cgggaaactg cgtttcaaga aaatcaagcc ggaagcattt 1680
gaagccaatc gtttttatac cgttattaat aaaaaaagcg gtgaaatcgt gccgatggaa 1740
gttaatttta actttgatga tccgaacttg attattctgc cgctggcatt cggtaaacgg 1800
cagggccgtg agtttatctg gaacgacctg ttatcgctgg aaacgggcag cctgaaatta 1860
gccaacggtc gcgtcattga aaaaacgctc tacaaccgcc gcacccgcca ggatgagccg 1920
gcactgtttg tcgcgctgac ctttgaacgg cgtgaagtcc tcgatagcag caacatcaaa 1980
ccaatgaacc ttatcggtat tgatcgtggt gaaaacattc ctgccgttat cgccctgact 2040
gatccagaag gctgcccgct ttctcgcttc aaagattcac tgggcaaccc gacccatatc 2100
ctccgtattg gcgagagcta caaagagaaa cagcgtacca ttcaggcaaa gaaagaagtg 2160
gagcagcgtc gcgcgggcgg ctatagccgt aaatatgcca gcaaagctaa aaacctggcg 2220
gatgacatgg tgcgtaacac ggcgcgcgat ttgctgtact acgccgtcac ccaggacgcg 2280
atgctgattt ttgagaacct ctcccgcggt tttgggcgtc agggtaaacg cacgtttatg 2340
gcggaacgcc agtatacgcg tatggaggac tggctgaccg cgaagctggc ctatgaaggc 2400
ttgtctaaaa cttacctgag caagaccctg gctcagtaca ccagtaaaac ctgtagtaat 2460
tgcggcttta ccatcaccag cgccgattat gaccgcgtgc tggaaaagct gaagaaaacc 2520
gccaccggct ggatgaccac catcaatggt aaagagctta aagtcgaagg gcagattact 2580
tattacaacc gttataagcg gcaaaacgtg gtgaaagatc tgtcggttga gctggaccgt 2640
ttgtctgaag aaagcgtgaa caatgatatc agctcctgga ccaaaggtcg ttccggcgaa 2700
gcgttaagtc tgttgaaaaa gcgctttagc catcgcccgg tgcaggaaaa attcgtttgc 2760
ctgaactgtg gcttcgaaac ccacgccgac gagcaagcgg cgctcaatat tgcgcgtagc 2820
tggctgttcc tgcgcagcca ggaatataaa aaatatcaaa ccaacaaaac aactggcaat 2880
accgacaagc gtgcctttgt tgaaacctgg cagagcttct atcgcaagaa gctgaaagag 2940
gtctggaaac cggcggtacc acctgcgcca aagaaaaaac gcaaagtgag cgaaaatctt 3000
tattttcaag gtagcgcatg gagtcatcct caattcgaga aaggtggagg ttctggcggt 3060
ggatcgggag gttcagcgtg gagccacccg cagttcgaaa aaggaagggg atccggctgc 3120
taa 3123
<210> 341
<211> 2928
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 457 variant
<400> 341
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300
cagcccgctc ctaagaacat cgaccagaga aagctgatcc ccgtgaagga cggcaacgag 360
agactgacct ctagcggctt tgcctgcagc cagtgttgcc agcctctgta cgtgtacaag 420
ctggaacaag tgaacgacaa gggcaagccc cacaccaact acttcggcag atgcaacgtg 480
tccgagcacg agaggctgat cctgctgtct cctcacaagc ccgaggccaa cgatgagctg 540
gtcacataca gcctgggcaa gttcggacag agagccctgg acttctacag catccacgtg 600
accagggaga gcaatcaccc tgtgaagccc ctggaacaga tcggcggcaa tagctgtgcc 660
tctggacctg tgggaaaagc cctgagcgac gcctgtatgg gagccgtggc atccttcctg 720
accaagtacc aggacatcat cctggaacac aagaaagtga tcaagaagaa cgagaaaaga 780
ctggccaacc tcaaggatat cgccagcgct aacggcctgg cctttcctaa gatcaccctg 840
cctccacagc ctcacaccaa agagggcatc gaggcctaca acaacgtggt ggcccagatc 900
gtgatttggg tcaacctgaa tctgtggcag aagctgaaga tcggcaggga cgaagccaag 960
ccactgcaga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 1020
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 1080
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 1140
ctgagcagcc ccgaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 1200
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 1260
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 1320
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 1380
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 1440
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 1500
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 1560
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 1620
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 1680
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 1740
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 1800
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaacccctg 1860
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 1920
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 1980
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 2040
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 2100
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 2160
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 2220
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 2280
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 2340
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 2400
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 2460
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 2520
aaagagctga aggttgaggg ccagatcacc tactacaaca ggaggaagag gcagaacgtc 2580
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 2640
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 2700
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 2760
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 2820
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 2880
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtg 2928
<210> 342
<211> 2928
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 438 variant
<400> 342
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300
cagcccgctc ctaagaacat cgaccagaga aagctgatcc ccgtgaagga cggcaacgag 360
agactgacct ctagcggctt tgcctgcagc cagtgttgcc agcctctgta cgtgtacaag 420
ctggaacaag tgaacgacaa gggcaagccc cacaccaact acttcggcag atgcaacgtg 480
tccgagcacg agaggctgat cctgctgtct cctcacaagc ccgaggccaa cgatgagctg 540
gtcacataca gcctgggcaa gttcggacag agagccctgg acttctacag catccacgtg 600
accagggaga gcaatcaccc tgtgaagccc ctggaacaga tcggcggcaa tagctgtgcc 660
tctggacctg tgggaaaagc cctgagcgac gcctgtatgg gagccgtggc atccttcctg 720
accaagtacc aggacatcat cctggaacac cagaaagtga tcaagaagaa cgagaaaaga 780
ctggccaacc tcaaggatat cgccagcgct aacggcctgg cctttcctaa gatcaccctg 840
cctccacagc ctcacaccaa agagggcatc gaggcctaca acaacgtggt ggcccagatc 900
gtgatttggg tcaacctgaa tctgtggcag aagctgaaga tcggcaggga cgaagccaag 960
ccactgcaga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 1020
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 1080
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 1140
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 1200
ctgctgaagc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 1260
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 1320
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 1380
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 1440
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 1500
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 1560
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 1620
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 1680
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 1740
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 1800
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 1860
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 1920
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 1980
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 2040
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 2100
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 2160
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 2220
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 2280
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 2340
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 2400
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 2460
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 2520
aaagagctga aggttgaggg ccagatcacc tactacaaca ggaggaagag gcagaacgtc 2580
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 2640
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 2700
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 2760
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 2820
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 2880
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtg 2928
<210> 343
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 119 variant
<400> 343
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val
195 200 205
Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu
225 230 235 240
Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys
245 250 255
Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly
260 265 270
Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys
305 310 315 320
Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 344
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 457 variant
<400> 344
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val
195 200 205
Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu
225 230 235 240
Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Lys Lys Val Ile Lys Lys
245 250 255
Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly
260 265 270
Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys
305 310 315 320
Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Pro
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp
385 390 395 400
Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Pro Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 345
<211> 976
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 438 variant
<400> 345
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu
100 105 110
Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala
115 120 125
Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val
130 135 140
Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala
165 170 175
Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala
180 185 190
Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val
195 200 205
Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val
210 215 220
Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu
225 230 235 240
Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys
245 250 255
Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly
260 265 270
Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu
275 280 285
Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val
290 295 300
Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys
305 310 315 320
Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg
325 330 335
Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys
340 345 350
Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu
355 360 365
Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu
370 375 380
Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp
385 390 395 400
Leu Leu Lys His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val
405 410 415
Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser
420 425 430
Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser
435 440 445
Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile
450 455 460
Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu
465 470 475 480
Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile
485 490 495
Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr
500 505 510
Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu
515 520 525
Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys
530 535 540
Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn
545 550 555 560
Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp
565 570 575
Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly
580 585 590
Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu
595 600 605
Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg
610 615 620
Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg
625 630 635 640
Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly
645 650 655
Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro
660 665 670
Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr
675 680 685
His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile
690 695 700
Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg
705 710 715 720
Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn
725 730 735
Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu
740 745 750
Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr
755 760 765
Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala
770 775 780
Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu
785 790 795 800
Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr
805 810 815
Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr
820 825 830
Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln
835 840 845
Ile Thr Tyr Tyr Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu
850 855 860
Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile
865 870 875 880
Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys
885 890 895
Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn
900 905 910
Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala
915 920 925
Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr
930 935 940
Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp
945 950 955 960
Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
965 970 975
<210> 346
<211> 2931
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 488 Variant
<400> 346
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 360
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 420
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 480
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 540
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 600
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 660
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 720
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 780
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 840
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 900
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 960
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 1140
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagttcggc 1200
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg catcgaccgg 1980
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 2160
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 2400
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 2460
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 2520
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 2580
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 2640
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 2700
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 2760
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 2820
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 2880
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt g 2931
<210> 347
<211> 2931
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 491 Variant
<400> 347
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 360
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 420
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 480
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 540
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 600
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 660
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 720
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 780
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 840
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 900
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 960
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 1140
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 1200
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 1980
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 2160
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 2400
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 2460
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 2520
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 2580
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 2640
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 2700
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 2760
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 2820
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 2880
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt g 2931
<210> 348
<211> 2934
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 515 Variant
<400> 348
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 120
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 180
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 240
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 300
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 360
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 420
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 480
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 540
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 600
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 660
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 720
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 780
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 840
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 900
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 960
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 1020
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 1080
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 1140
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 1200
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 1260
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 1320
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 1380
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 1440
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 1500
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 1560
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 1620
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 1680
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 1740
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 1800
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 1860
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 1920
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 1980
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 2040
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 2100
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 2160
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 2220
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 2280
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 2340
gattggctca cagctaaact ggcctacgag ggactgccca gcaagaccta cctgtccaaa 2400
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 2460
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 2520
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 2580
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 2640
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 2700
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 2760
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 2820
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 2880
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtg 2934
<210> 349
<211> 2934
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 527 Variant
<400> 349
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 60
aaggccggca agacacgggg ccccatgaaa accctgctcg tcagagtgat gacccctgac 120
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 180
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 240
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 300
gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 360
ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 420
aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 480
gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 540
gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 600
cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 660
tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 720
ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 780
aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 840
accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 900
agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 960
gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 1020
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 1080
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 1140
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 1200
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 1260
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 1320
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 1380
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 1440
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 1500
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 1560
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 1620
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 1680
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 1740
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 1800
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 1860
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 1920
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 1980
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 2040
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 2100
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 2160
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 2220
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 2280
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 2340
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 2400
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 2460
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 2520
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 2580
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 2640
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 2700
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 2760
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 2820
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 2880
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtg 2934
<210> 350
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 488 Variant
<400> 350
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 351
<211> 977
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 491 Variant
<400> 351
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val
<210> 352
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 515 Variant
<400> 352
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu
20 25 30
Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg
35 40 45
Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala
50 55 60
Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile
65 70 75 80
Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met
85 90 95
Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu
100 105 110
Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala
115 120 125
Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val
130 135 140
Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val
145 150 155 160
Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys
165 170 175
Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His Pro
195 200 205
Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe
225 230 235 240
Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val Lys
245 250 255
Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu
260 265 270
Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala
305 310 315 320
Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Pro Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 353
<211> 978
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 527 Variant
<400> 353
Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp
1 5 10 15
Ser Asn Thr Lys Lys Ala Gly Lys Thr Arg Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys
100 105 110
Leu Lys Pro Glu Met Asp Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe
115 120 125
Ala Cys Ser Gln Cys Gly Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln
130 135 140
Val Ser Glu Lys Gly Lys Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ala Glu His Glu Lys Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu
165 170 175
Lys Asp Ser Asp Glu Ala Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Lys Glu Ser Thr His
195 200 205
Pro Val Lys Pro Leu Ala Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Thr Ile Ala Ser
225 230 235 240
Phe Leu Ser Lys Tyr Gln Asp Ile Ile Ile Glu His Gln Lys Val Val
245 250 255
Lys Gly Asn Gln Lys Arg Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys
260 265 270
Glu Asn Leu Glu Tyr Pro Ser Val Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Val Asp Ala Tyr Asn Glu Val Ile Ala Arg Val Arg Met
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp
305 310 315 320
Ala Lys Pro Leu Leu Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Val Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val
<210> 354
<211> 3120
<212> DNA
<213> Artificial Sequence
<220>
<223> SV40 NLS-CasX-SV40 NLS-TEV cleavage site - TwinStrep tag
<400> 354
atggctccga agaagaagcg aaaggtcagc caggaaatta aacgcatcaa caagatccgc 60
cgtcgtctgg taaaagacag caatacgaaa aaagccggaa aaaccggtcc gatgaaaacg 120
ctgctggtgc gcgtgatgac gccggatctc cgcgaacgtc ttgagaattt gcgtaagaaa 180
cctgaaaata ttccgcaacc gatttctaac acctcgcgcg ccaatctgaa taaactgctg 240
accgattaca ccgaaatgaa gaaagcgatt ctgcacgttt actgggaaga gttccagaaa 300
gacccggtcg gtctgatgag ccgcgttgcg caacctgcgc cgaaaaatat cgatcagcgc 360
aagttaatcc cggttaaaga tggtaatgaa cgtttaacct ccagcggctt tgcctgcagt 420
cagtgctgcc agccacttta tgtttataaa cttgaacagg ttaacgataa agggaaaccc 480
cataccaatt atttcggccg ctgcaatgtc agcgaacatg aacgcctgat tttgttaagc 540
ccgcataaac cggaagcgaa tgacgaactg gtgacctatt ccctgggtaa atttggtcag 600
cgggcgctgg atttttacag cattcatgtg acgcgggaaa gtaaccatcc ggtaaagcca 660
ctggaacaaa tcggcggtaa cagctgcgcc tctggcccgg ttggcaaagc gcttagcgat 720
gcctgtatgg gcgcggtggc gagctttctg acaaaatacc aggatattat cctggagcat 780
cagaaggtga tcaaaaagaa cgagaaacgt ctggcaaatt taaaggatat tgcctccgct 840
aacggcctgg cgttcccgaa gattacctta ccgccgcagc cgcacaccaa agaaggtatc 900
gaagcgtata acaacgttgt tgcccagatc gtcatctggg tgaatctcaa cctgtggcaa 960
aaactgaaaa ttggtcgtga tgaagcaaaa ccgttgcagc gactgaaagg attcccgtcg 1020
tttccgctgg ttgaacgaca ggcgaacgaa gtggattggt gggatatggt ttgtaacgtc 1080
aaaaaattga tcaacgaaaa aaaggaagat ggcaaagttt tctggcaaaa tctggcgggt 1140
tacaaacgtc aggaggcgtt gcttccgtat ctctcttcag aagaagatcg caaaaaaggc 1200
aagaagtttg ctcgctatca gtttggcgat ttattactgc atctggaaaa aaaacacggc 1260
gaagactggg gcaaagtgta cgatgaagcc tgggagcgta tcgacaaaaa agtggaaggt 1320
ttgtcgaaac atattaaact cgaagaagag cgccgcagtg aagatgcgca gtcaaaagca 1380
gcgctgacgg actggttacg tgcgaaagcc agttttgtga ttgaaggatt aaaagaagct 1440
gataaagatg aattttgccg ttgcgaactg aaactgcaaa aatggtatgg cgacctgcgc 1500
ggcaaaccgt tcgccattga ggcagaaaat agcatccttg atatctccgg tttcagcaaa 1560
caatataact gcgcgtttat ttggcagaaa gacggcgtga aaaagcttaa cctgtatctg 1620
atcattaact attttaaagg cgggaaactg cgtttcaaga aaatcaagcc ggaagcattt 1680
gaagccaatc gtttttatac cgttattaat aaaaaaagcg gtgaaatcgt gccgatggaa 1740
gttaatttta actttgatga tccgaacttg attattctgc cgctggcatt cggtaaacgg 1800
cagggccgtg agtttatctg gaacgacctg ttatcgctgg aaacgggcag cctgaaatta 1860
gccaacggtc gcgtcattga aaaaacgctc tacaaccgcc gcacccgcca ggatgagccg 1920
gcactgtttg tcgcgctgac ctttgaacgg cgtgaagtcc tcgatagcag caacatcaaa 1980
ccaatgaacc ttatcggtat tgatcgtggt gaaaacattc ctgccgttat cgccctgact 2040
gatccagaag gctgcccgct ttctcgcttc aaagattcac tgggcaaccc gacccatatc 2100
ctccgtattg gcgagagcta caaagagaaa cagcgtacca ttcaggcagc caaagaagtg 2160
gagcagcgtc gcgcgggcgg ctatagccgt aaatatgcca gcaaagctaa aaacctggcg 2220
gatgacatgg tgcgtaacac ggcgcgcgat ttgctgtact acgccgtcac ccaggacgcg 2280
atgctgattt ttgagaacct ctcccgcggt tttgggcgtc agggtaaacg cacgtttatg 2340
gcggaacgcc agtatacgcg tatggaggac tggctgaccg cgaagctggc ctatgaaggc 2400
ttgccgtcta aaacttacct gagcaagacc ctggctcagt acaccagtaa aacctgtagt 2460
aattgcggct ttaccatcac cagcgccgat tatgaccgcg tgctggaaaa gctgaagaaa 2520
accgccaccg gctggatgac caccatcaat ggtaaagagc ttaaagtcga agggcagatt 2580
acttattaca accgttataa gcggcaaaac gtggtgaaag atctgtcggt tgagctggac 2640
cgtttgtctg aagaaagcgt gaacaatgat atcagctcct ggaccaaagg tcgttccggc 2700
gaagcgttaa gtctgttgaa aaagcgcttt agccatcgcc cggtgcagga aaaattcgtt 2760
tgcctgaact gtggcttcga aacccacgcc gacgagcaag cggcgctcaa tattgcgcgt 2820
agctggctgt tcctgcgcag ccaggaatat aaaaaatatc aaaccaacaa aacaactggc 2880
aataccgaca agcgtgcctt tgttgaaacc tggcagagct tctatcgcaa aaaactgaaa 2940
gaggtctgga aaccggcggt agcgccaaag aaaaaacgca aagtgagcga aaatctttat 3000
tttcaaggta gcgcatggag tcatcctcaa ttcgagaaag gtggaggttc tggcggtgga 3060
tcgggaggtt cagcgtggag ccacccgcag ttcgaaaaag gaaggggatc cggctgctaa 3120
<210> 355
<211> 987
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 355
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp
115 120 125
Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys
130 135 140
Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys
145 150 155 160
Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg
165 170 175
Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val
180 185 190
Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser
195 200 205
Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu Gln
210 215 220
Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu Ser
225 230 235 240
Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln Asp
245 250 255
Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg Leu
260 265 270
Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro Lys
275 280 285
Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala Tyr
290 295 300
Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu Trp
305 310 315 320
Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg Leu
325 330 335
Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val
340 345 350
Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys
355 360 365
Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg
370 375 380
Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys
385 390 395 400
Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His Leu
405 410 415
Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp
420 425 430
Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu
435 440 445
Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr
450 455 460
Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu
465 470 475 480
Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp
485 490 495
Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser
500 505 510
Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile
515 520 525
Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn
530 535 540
Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala
545 550 555 560
Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu
565 570 575
Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile
580 585 590
Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp
595 600 605
Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly
610 615 620
Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu
625 630 635 640
Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp
645 650 655
Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu
660 665 670
Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu
675 680 685
Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile
690 695 700
Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu
705 710 715 720
Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys
725 730 735
Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu
740 745 750
Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu
755 760 765
Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg
770 775 780
Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu
785 790 795 800
Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser
805 810 815
Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp
820 825 830
Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr
835 840 845
Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn
850 855 860
Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp
865 870 875 880
Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys
885 890 895
Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His
900 905 910
Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr
915 920 925
His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe
930 935 940
Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly
945 950 955 960
Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg
965 970 975
Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val
980 985
<210> 356
<211> 986
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 356
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val
980 985
<210> 357
<211> 996
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 357
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Lys Lys
980 985 990
Lys Arg Lys Val
995
<210> 358
<211> 1006
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 358
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro His Lys Lys
980 985 990
Lys His Pro Asp Ala Ser Val Asn Phe Ser Glu Phe Ser Lys
995 1000 1005
<210> 359
<211> 1007
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 359
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Gln Arg Pro
980 985 990
Gly Pro Tyr Asp Arg Pro Gln Arg Pro Gly Pro Tyr Asp Arg Pro
995 1000 1005
<210> 360
<211> 1005
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 360
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Leu Ser Pro
980 985 990
Ser Leu Ser Pro Leu Leu Ser Pro Ser Leu Ser Pro Leu
995 1000 1005
<210> 361
<211> 1008
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 361
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Met Ser Ser Gly
115 120 125
Phe Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu
130 135 140
Gln Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys
145 150 155 160
Asn Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro
165 170 175
Glu Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln
180 185 190
Arg Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His
195 200 205
Pro Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly
210 215 220
Pro Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser
225 230 235 240
Phe Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile
245 250 255
Lys Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala
260 265 270
Asn Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr
275 280 285
Lys Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile
290 295 300
Trp Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu
305 310 315 320
Ala Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val
325 330 335
Glu Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val
340 345 350
Lys Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln
355 360 365
Asn Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser
370 375 380
Ser Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe
385 390 395 400
Gly Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly
405 410 415
Lys Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly
420 425 430
Leu Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala
435 440 445
Gln Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe
450 455 460
Val Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys
465 470 475 480
Glu Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe
485 490 495
Ala Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys
500 505 510
Gln Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu
515 520 525
Asn Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe
530 535 540
Lys Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val
545 550 555 560
Ile Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn
565 570 575
Phe Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg
580 585 590
Gln Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly
595 600 605
Ser Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn
610 615 620
Arg Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe
625 630 635 640
Glu Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu
645 650 655
Ile Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr
660 665 670
Asp Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn
675 680 685
Pro Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg
690 695 700
Thr Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr
705 710 715 720
Ser Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val
725 730 735
Arg Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala
740 745 750
Met Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys
755 760 765
Arg Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu
770 775 780
Thr Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys
785 790 795 800
Thr Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr
805 810 815
Ile Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr
820 825 830
Ala Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu
835 840 845
Gly Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys
850 855 860
Asp Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn
865 870 875 880
Asp Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu
885 890 895
Leu Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys
900 905 910
Leu Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn
915 920 925
Ile Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr
930 935 940
Gln Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu
945 950 955 960
Thr Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro
965 970 975
Ala Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Arg Gly
980 985 990
Lys Gly Gly Lys Gly Leu Gly Lys Gly Gly Ala Lys Arg His Arg Lys
995 1000 1005
<210> 362
<211> 1013
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 362
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Ser Arg Arg
980 985 990
Arg Lys Ala Asn Pro Thr Lys Leu Ser Glu Asn Ala Lys Lys Leu Ala
995 1000 1005
Lys Glu Val Glu Asn
1010
<210> 363
<211> 998
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 363
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Pro Ala Ala
980 985 990
Lys Arg Val Lys Leu Asp
995
<210> 364
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 364
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Lys Arg Ser
980 985 990
Phe Ser Lys Ala Phe
995
<210> 365
<211> 1008
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 365
Met Gln Glu Ile Lys Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys
1 5 10 15
Asp Ser Asn Thr Lys Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu
20 25 30
Leu Val Arg Val Met Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu
35 40 45
Arg Lys Lys Pro Glu Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg
50 55 60
Ala Asn Leu Asn Lys Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala
65 70 75 80
Ile Leu His Val Tyr Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu
85 90 95
Met Ser Arg Val Ala Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys
100 105 110
Leu Ile Pro Val Lys Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe
115 120 125
Ala Cys Ser Gln Cys Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln
130 135 140
Val Asn Asp Lys Gly Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn
145 150 155 160
Val Ser Glu His Glu Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu
165 170 175
Ala Asn Asp Glu Leu Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg
180 185 190
Ala Leu Asp Phe Tyr Ser Ile His Val Thr Arg Glu Ser Asn His Pro
195 200 205
Val Lys Pro Leu Glu Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro
210 215 220
Val Gly Lys Ala Leu Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe
225 230 235 240
Leu Thr Lys Tyr Gln Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys
245 250 255
Lys Asn Glu Lys Arg Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn
260 265 270
Gly Leu Ala Phe Pro Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys
275 280 285
Glu Gly Ile Glu Ala Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp
290 295 300
Val Asn Leu Asn Leu Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala
305 310 315 320
Lys Pro Leu Gln Arg Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu
325 330 335
Arg Gln Ala Asn Glu Val Asp Trp Trp Asp Met Val Cys Asn Val Lys
340 345 350
Lys Leu Ile Asn Glu Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn
355 360 365
Leu Ala Gly Tyr Lys Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser
370 375 380
Glu Glu Asp Arg Lys Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly
385 390 395 400
Asp Leu Leu Leu His Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys
405 410 415
Val Tyr Asp Glu Ala Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu
420 425 430
Ser Lys His Ile Lys Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln
435 440 445
Ser Lys Ala Ala Leu Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val
450 455 460
Ile Glu Gly Leu Lys Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu
465 470 475 480
Leu Lys Leu Gln Lys Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala
485 490 495
Ile Glu Ala Glu Asn Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln
500 505 510
Tyr Asn Cys Ala Phe Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn
515 520 525
Leu Tyr Leu Ile Ile Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys
530 535 540
Lys Ile Lys Pro Glu Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile
545 550 555 560
Asn Lys Lys Ser Gly Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe
565 570 575
Asp Asp Pro Asn Leu Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln
580 585 590
Gly Arg Glu Phe Ile Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser
595 600 605
Leu Lys Leu Ala Asn Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg
610 615 620
Arg Thr Arg Gln Asp Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu
625 630 635 640
Arg Arg Glu Val Leu Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile
645 650 655
Gly Ile Asp Arg Gly Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp
660 665 670
Pro Glu Gly Cys Pro Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro
675 680 685
Thr His Ile Leu Arg Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr
690 695 700
Ile Gln Ala Lys Lys Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser
705 710 715 720
Arg Lys Tyr Ala Ser Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg
725 730 735
Asn Thr Ala Arg Asp Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met
740 745 750
Leu Ile Phe Glu Asn Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg
755 760 765
Thr Phe Met Ala Glu Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr
770 775 780
Ala Lys Leu Ala Tyr Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr
785 790 795 800
Leu Ala Gln Tyr Thr Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile
805 810 815
Thr Ser Ala Asp Tyr Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala
820 825 830
Thr Gly Trp Met Thr Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly
835 840 845
Gln Ile Thr Tyr Tyr Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp
850 855 860
Leu Ser Val Glu Leu Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp
865 870 875 880
Ile Ser Ser Trp Thr Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu
885 890 895
Lys Lys Arg Phe Ser His Arg Pro Val Gln Glu Lys Phe Val Cys Leu
900 905 910
Asn Cys Gly Phe Glu Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile
915 920 925
Ala Arg Ser Trp Leu Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln
930 935 940
Thr Asn Lys Thr Thr Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr
945 950 955 960
Trp Gln Ser Phe Tyr Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala
965 970 975
Val Thr Ser Pro Lys Lys Lys Arg Lys Val Pro Pro Pro Lys Arg Gly
980 985 990
Ile Asn Asp Arg Asn Phe Trp Arg Gly Glu Asn Glu Arg Lys Thr Arg
995 1000 1005
<210> 366
<211> 1007
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 366
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Met Gln Glu Ile Lys
1 5 10 15
Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys
20 25 30
Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met
35 40 45
Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu
50 55 60
Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys
65 70 75 80
Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr
85 90 95
Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala
100 105 110
Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys
115 120 125
Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys
130 135 140
Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly
145 150 155 160
Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu
165 170 175
Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu
210 215 220
Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln
245 250 255
Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg
260 265 270
Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro
275 280 285
Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala
290 295 300
Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val Pro Pro Pro Pro Lys Lys Lys Arg Lys Val
995 1000 1005
<210> 367
<211> 1009
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX Variant Sequence
<400> 367
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Met Gln Glu Ile Lys
1 5 10 15
Arg Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys
20 25 30
Lys Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met
35 40 45
Thr Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu
50 55 60
Asn Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys
65 70 75 80
Leu Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr
85 90 95
Trp Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala
100 105 110
Gln Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys
115 120 125
Asp Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys
130 135 140
Cys Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly
145 150 155 160
Lys Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu
165 170 175
Arg Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu
210 215 220
Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln
245 250 255
Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg
260 265 270
Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro
275 280 285
Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala
290 295 300
Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val Pro Pro Pro Pro Ala Ala Lys Arg Val Lys Leu
995 1000 1005
Asp
<210> 368
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 368
ccaaagaaga agcggaaggt c 21
<210> 369
<211> 51
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 369
cacaagaaga aacatccaga cgcatcagtc aactttagcg agttcagtaa a 51
<210> 370
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 370
cagcgccctg ggccttacga taggccgcaa agacccggac cgtatgatcg ccct 54
<210> 371
<211> 48
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 371
ctcagcccga gtcttagtcc actgctttcc ccgtccctgt ctccactg 48
<210> 372
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 372
cggggcaagg gtggcaaggg gcttggcaag gggggggcaa agaggcacag gaag 54
<210> 373
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 373
agccgccgca gaaaagccaa tcctacaaaa ctgtcagaaa atgcgaaaaa acttgctaag 60
gaggtggaaa a 71
<210> 374
<211> 27
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 374
cctgccgcaa agcgagtgaa attggac 27
<210> 375
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 375
aagcggtcct tcagtaaggc cttt 24
<210> 376
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 376
aaacggggaa taaacgaccg gaacttctgg cgcggggaaa acgagcgcaa aacccga 57
<210> 377
<211> 17
<212> PRT
<213> Artificial Sequence
<220>
<223> nuclear localization sequence
<400> 377
His Lys Lys Lys His Pro Asp Ala Ser Val Asn Phe Ser Glu Phe Ser
1 5 10 15
Lys
<210> 378
<211> 2991
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 387 Variant Sequence
<400> 378
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600
ggacagagag ccctggactt ctacagcatc cacgtgacca gggagagcaa tcaccctgtg 660
aagcccctgg aacagatcgg cggcaatagc tgtgcctctg gacctgtggg aaaagccctg 720
agcgacgcct gtatgggagc cgtggcatcc ttcctgacca agtaccagga catcatcctg 780
gaacaccaga aagtgatcaa gaagaacgag aaaagactgg ccaacctcaa ggatatcgcc 840
agcgctaacg gcctggcctt tcctaagatc accctgcctc cacagcctca caccaaagag 900
ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga tttgggtcaa cctgaatctg 960
tggcagaagc tgaagatcgg cagggacgaa gccaagccac tgcagagact gaagggcttc 1020
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200
aagggcaaga agttcgccag ataccagttc ggcgacctgc tgctgcacct ggaaaagaag 1260
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980
atcaagccca tgaacctgat cggcatcgac cggggcgaga atatccctgc tgtgatcgcc 2040
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991
<210> 379
<211> 2988
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 395 Variant Sequence
<400> 379
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360
agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420
agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480
ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540
tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200
ggcaagaagt tcgccagata ccagttcggc gacctgctgc tgcacctgga aaagaagcac 1260
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980
aagcccatga acctgatcgg catcgaccgg ggcgagaata tccctgctgt gatcgccctg 2040
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988
<210> 380
<211> 2988
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 485 Variant Sequence
<400> 380
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360
agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420
agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480
ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540
tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 1260
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 2040
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580
acctactaca acaggaggaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988
<210> 381
<211> 2988
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 486 Variant Seqence
<400> 381
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360
agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420
agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480
ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540
tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200
ggcaagaagt tcgccagata ccagctgggc gacctgctga agcacctgga aaagaagcac 1260
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 2040
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580
acctactaca acaggaggaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988
<210> 382
<211> 2988
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 487 Variant Sequence
<400> 382
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcccg ctcctaagaa catcgaccag 360
agaaagctga tccccgtgaa ggacggcaac gagagactga cctctagcgg ctttgcctgc 420
agccagtgtt gccagcctct gtacgtgtac aagctggaac aagtgaacga caagggcaag 480
ccccacacca actacttcgg cagatgcaac gtgtccgagc acgagaggct gatcctgctg 540
tctcctcaca agcccgaggc caacgatgag ctggtcacat acagcctggg caagttcgga 600
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 660
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 720
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 780
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 840
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 900
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 960
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 1020
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 1080
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 1140
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 1200
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 1260
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 1320
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 1380
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 1440
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 1500
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 1560
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 1620
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 1680
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 1740
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 1800
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 1860
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 1920
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 1980
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 2040
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 2100
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 2160
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 2220
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 2280
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 2340
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 2400
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 2460
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 2520
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 2580
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 2640
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 2700
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 2760
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 2820
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 2880
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 2940
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggta 2988
<210> 383
<211> 2991
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 488 Variant Sequence
<400> 383
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200
aagggcaaga agttcgccag ataccagttc ggcgacctgc tgctgcacct ggaaaagaag 1260
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980
atcaagccca tgaacctgat cggcatcgac cggggcgaga atatccctgc tgtgatcgcc 2040
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991
<210> 384
<211> 2991
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 489 Variant Sequence
<400> 384
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 1260
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580
atcacctact acaacaggag gaagaggcag aacgtcgtga aggatctgag cgtggaactg 2640
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991
<210> 385
<211> 2991
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 490 Variant Sequence
<400> 385
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgaagcacct ggaaaagaag 1260
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580
atcacctact acaacaggag gaagaggcag aacgtcgtga aggatctgag cgtggaactg 2640
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991
<210> 386
<211> 2991
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 491 Variant Sequence
<400> 386
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 660
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 720
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 780
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 840
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 900
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 960
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 1020
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 1260
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991
<210> 387
<211> 2991
<212> DNA
<213> Artificial Sequence
<220>
<223> CasX 495 Variant Sequence
<400> 387
atggccccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 60
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 120
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 180
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 240
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 300
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 360
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 420
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 480
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 540
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 600
ggacagagag ccctggactt ctacagcatc cacgtgacca gggagagcaa tcaccctgtg 660
aagcccctgg aacagatcgg cggcaatagc tgtgcctctg gacctgtggg aaaagccctg 720
agcgacgcct gtatgggagc cgtggcatcc ttcctgacca agtaccagga catcatcctg 780
gaacaccaga aagtgatcaa gaagaacgag aaaagactgg ccaacctcaa ggatatcgcc 840
agcgctaacg gcctggcctt tcctaagatc accctgcctc cacagcctca caccaaagag 900
ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga tttgggtcaa cctgaatctg 960
tggcagaagc tgaagatcgg cagggacgaa gccaagccac tgcagagact gaagggcttc 1020
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 1080
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 1140
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 1200
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 1260
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 1320
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 1380
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 1440
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 1500
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 1560
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 1620
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 1680
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 1740
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 1800
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 1860
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 1920
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 1980
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 2040
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 2100
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 2160
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 2220
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 2280
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 2340
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 2400
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 2460
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 2520
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 2580
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 2640
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 2700
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 2760
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 2820
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 2880
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 2940
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt a 2991
<210> 388
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 387 Variant Sequence
<400> 388
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp
115 120 125
Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly
130 135 140
Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys
145 150 155 160
Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys
165 170 175
Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu
210 215 220
Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln
245 250 255
Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg
260 265 270
Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro
275 280 285
Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala
290 295 300
Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val
995
<210> 389
<211> 1005
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 395 Variant Sequence
<400> 389
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp
115 120 125
Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys
130 135 140
Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys
145 150 155 160
Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg
165 170 175
Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val
180 185 190
Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser
195 200 205
Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln
210 215 220
Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser
225 230 235 240
Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp
245 250 255
Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu
260 265 270
Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser
275 280 285
Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr
290 295 300
Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp
305 310 315 320
Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu
325 330 335
Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val
340 345 350
Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys
355 360 365
Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg
370 375 380
Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys
385 390 395 400
Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His Leu
405 410 415
Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp
420 425 430
Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu
435 440 445
Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr
450 455 460
Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu
465 470 475 480
Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp
485 490 495
Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser
500 505 510
Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile
515 520 525
Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn
530 535 540
Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala
545 550 555 560
Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu
565 570 575
Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile
580 585 590
Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp
595 600 605
Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly
610 615 620
Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu
625 630 635 640
Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp
645 650 655
Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly Glu
660 665 670
Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu
675 680 685
Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile
690 695 700
Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu
705 710 715 720
Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys
725 730 735
Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu
740 745 750
Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu
755 760 765
Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg
770 775 780
Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu
785 790 795 800
Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser
805 810 815
Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp
820 825 830
Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr
835 840 845
Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn
850 855 860
Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp
865 870 875 880
Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys
885 890 895
Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His
900 905 910
Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr
915 920 925
His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe
930 935 940
Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly
945 950 955 960
Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg
965 970 975
Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys
980 985 990
Lys Arg Lys Val Thr Ser Pro Lys Lys Lys Arg Lys Val
995 1000 1005
<210> 390
<211> 996
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 485 Variant Sequence
<400> 390
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp
115 120 125
Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys
130 135 140
Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys
145 150 155 160
Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg
165 170 175
Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val
180 185 190
Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser
195 200 205
Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln
210 215 220
Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser
225 230 235 240
Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp
245 250 255
Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu
260 265 270
Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser
275 280 285
Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr
290 295 300
Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp
305 310 315 320
Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu
325 330 335
Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val
340 345 350
Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys
355 360 365
Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg
370 375 380
Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys
385 390 395 400
Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His Leu
405 410 415
Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp
420 425 430
Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu
435 440 445
Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr
450 455 460
Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu
465 470 475 480
Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp
485 490 495
Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser
500 505 510
Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile
515 520 525
Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn
530 535 540
Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala
545 550 555 560
Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu
565 570 575
Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile
580 585 590
Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp
595 600 605
Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly
610 615 620
Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu
625 630 635 640
Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp
645 650 655
Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly Glu
660 665 670
Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu
675 680 685
Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile
690 695 700
Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu
705 710 715 720
Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys
725 730 735
Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu
740 745 750
Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu
755 760 765
Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg
770 775 780
Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu
785 790 795 800
Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser
805 810 815
Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp
820 825 830
Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr
835 840 845
Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn
850 855 860
Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp
865 870 875 880
Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys
885 890 895
Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His
900 905 910
Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr
915 920 925
His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe
930 935 940
Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly
945 950 955 960
Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg
965 970 975
Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys
980 985 990
Lys Arg Lys Val
995
<210> 391
<211> 996
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 486 Variant Seqence
<400> 391
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp
115 120 125
Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys
130 135 140
Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys
145 150 155 160
Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg
165 170 175
Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val
180 185 190
Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser
195 200 205
Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln
210 215 220
Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser
225 230 235 240
Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp
245 250 255
Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu
260 265 270
Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser
275 280 285
Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr
290 295 300
Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp
305 310 315 320
Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu
325 330 335
Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val
340 345 350
Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys
355 360 365
Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg
370 375 380
Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys
385 390 395 400
Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Lys His Leu
405 410 415
Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp
420 425 430
Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu
435 440 445
Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr
450 455 460
Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu
465 470 475 480
Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp
485 490 495
Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser
500 505 510
Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile
515 520 525
Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn
530 535 540
Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala
545 550 555 560
Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu
565 570 575
Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile
580 585 590
Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp
595 600 605
Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly
610 615 620
Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu
625 630 635 640
Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp
645 650 655
Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly Glu
660 665 670
Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu
675 680 685
Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile
690 695 700
Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu
705 710 715 720
Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys
725 730 735
Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu
740 745 750
Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu
755 760 765
Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg
770 775 780
Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu
785 790 795 800
Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser
805 810 815
Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp
820 825 830
Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr
835 840 845
Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn
850 855 860
Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp
865 870 875 880
Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys
885 890 895
Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His
900 905 910
Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr
915 920 925
His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe
930 935 940
Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly
945 950 955 960
Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg
965 970 975
Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys
980 985 990
Lys Arg Lys Val
995
<210> 392
<211> 996
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 487 Variant Sequence
<400> 392
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Pro Lys Asn Ile Asp Gln Arg Lys Leu Ile Pro Val Lys Asp
115 120 125
Gly Asn Glu Arg Leu Thr Ser Ser Gly Phe Ala Cys Ser Gln Cys Cys
130 135 140
Gln Pro Leu Tyr Val Tyr Lys Leu Glu Gln Val Asn Asp Lys Gly Lys
145 150 155 160
Pro His Thr Asn Tyr Phe Gly Arg Cys Asn Val Ser Glu His Glu Arg
165 170 175
Leu Ile Leu Leu Ser Pro His Lys Pro Glu Ala Asn Asp Glu Leu Val
180 185 190
Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr Ser
195 200 205
Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala Gln
210 215 220
Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu Ser
225 230 235 240
Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln Asp
245 250 255
Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg Leu
260 265 270
Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro Ser
275 280 285
Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala Tyr
290 295 300
Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu Trp
305 310 315 320
Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg Leu
325 330 335
Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu Val
340 345 350
Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu Lys
355 360 365
Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys Arg
370 375 380
Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys Lys
385 390 395 400
Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His Leu
405 410 415
Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala Trp
420 425 430
Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys Leu
435 440 445
Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu Thr
450 455 460
Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys Glu
465 470 475 480
Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys Trp
485 490 495
Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn Ser
500 505 510
Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe Ile
515 520 525
Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile Asn
530 535 540
Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu Ala
545 550 555 560
Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly Glu
565 570 575
Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu Ile
580 585 590
Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile Trp
595 600 605
Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn Gly
610 615 620
Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp Glu
625 630 635 640
Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu Asp
645 650 655
Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly Glu
660 665 670
Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro Leu
675 680 685
Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg Ile
690 695 700
Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys Glu
705 710 715 720
Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser Lys
725 730 735
Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp Leu
740 745 750
Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn Leu
755 760 765
Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu Arg
770 775 780
Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr Glu
785 790 795 800
Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr Ser
805 810 815
Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr Asp
820 825 830
Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr Thr
835 840 845
Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr Asn
850 855 860
Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu Asp
865 870 875 880
Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr Lys
885 890 895
Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser His
900 905 910
Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu Thr
915 920 925
His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu Phe
930 935 940
Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr Gly
945 950 955 960
Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr Arg
965 970 975
Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys Lys
980 985 990
Lys Arg Lys Val
995
<210> 393
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 488 Variant Sequence
<400> 393
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp
115 120 125
Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly
130 135 140
Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys
145 150 155 160
Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys
165 170 175
Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala
210 215 220
Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln
245 250 255
Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg
260 265 270
Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro
275 280 285
Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala
290 295 300
Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Phe Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Ile Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val
995
<210> 394
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 489 Variant Sequence
<400> 394
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp
115 120 125
Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly
130 135 140
Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys
145 150 155 160
Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys
165 170 175
Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala
210 215 220
Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln
245 250 255
Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg
260 265 270
Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro
275 280 285
Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala
290 295 300
Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val
995
<210> 395
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 490 Variant Sequence
<400> 395
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp
115 120 125
Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly
130 135 140
Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys
145 150 155 160
Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys
165 170 175
Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala
210 215 220
Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln
245 250 255
Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg
260 265 270
Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro
275 280 285
Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala
290 295 300
Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Lys His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Arg Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val
995
<210> 396
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 491 Variant Sequence
<400> 396
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp
115 120 125
Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly
130 135 140
Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys
145 150 155 160
Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys
165 170 175
Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Lys Glu Ser Thr His Pro Val Lys Pro Leu Ala
210 215 220
Gln Ile Ala Gly Asn Arg Tyr Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Thr Ile Ala Ser Phe Leu Ser Lys Tyr Gln
245 250 255
Asp Ile Ile Ile Glu His Gln Lys Val Val Lys Gly Asn Gln Lys Arg
260 265 270
Leu Glu Ser Leu Arg Glu Leu Ala Gly Lys Glu Asn Leu Glu Tyr Pro
275 280 285
Ser Val Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Val Asp Ala
290 295 300
Tyr Asn Glu Val Ile Ala Arg Val Arg Met Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Leu Ser Arg Asp Asp Ala Lys Pro Leu Leu Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val
995
<210> 397
<211> 997
<212> PRT
<213> Artificial Sequence
<220>
<223> CasX 495 Variant Sequence
<400> 397
Met Ala Pro Lys Lys Lys Arg Lys Val Ser Arg Gln Glu Ile Lys Arg
1 5 10 15
Ile Asn Lys Ile Arg Arg Arg Leu Val Lys Asp Ser Asn Thr Lys Lys
20 25 30
Ala Gly Lys Thr Gly Pro Met Lys Thr Leu Leu Val Arg Val Met Thr
35 40 45
Pro Asp Leu Arg Glu Arg Leu Glu Asn Leu Arg Lys Lys Pro Glu Asn
50 55 60
Ile Pro Gln Pro Ile Ser Asn Thr Ser Arg Ala Asn Leu Asn Lys Leu
65 70 75 80
Leu Thr Asp Tyr Thr Glu Met Lys Lys Ala Ile Leu His Val Tyr Trp
85 90 95
Glu Glu Phe Gln Lys Asp Pro Val Gly Leu Met Ser Arg Val Ala Gln
100 105 110
Pro Ala Ser Lys Lys Ile Asp Gln Asn Lys Leu Lys Pro Glu Met Asp
115 120 125
Glu Lys Gly Asn Leu Thr Thr Ala Gly Phe Ala Cys Ser Gln Cys Gly
130 135 140
Gln Pro Leu Phe Val Tyr Lys Leu Glu Gln Val Ser Glu Lys Gly Lys
145 150 155 160
Ala Tyr Thr Asn Tyr Phe Gly Arg Cys Asn Val Ala Glu His Glu Lys
165 170 175
Leu Ile Leu Leu Ala Gln Leu Lys Pro Glu Lys Asp Ser Asp Glu Ala
180 185 190
Val Thr Tyr Ser Leu Gly Lys Phe Gly Gln Arg Ala Leu Asp Phe Tyr
195 200 205
Ser Ile His Val Thr Arg Glu Ser Asn His Pro Val Lys Pro Leu Glu
210 215 220
Gln Ile Gly Gly Asn Ser Cys Ala Ser Gly Pro Val Gly Lys Ala Leu
225 230 235 240
Ser Asp Ala Cys Met Gly Ala Val Ala Ser Phe Leu Thr Lys Tyr Gln
245 250 255
Asp Ile Ile Leu Glu His Gln Lys Val Ile Lys Lys Asn Glu Lys Arg
260 265 270
Leu Ala Asn Leu Lys Asp Ile Ala Ser Ala Asn Gly Leu Ala Phe Pro
275 280 285
Lys Ile Thr Leu Pro Pro Gln Pro His Thr Lys Glu Gly Ile Glu Ala
290 295 300
Tyr Asn Asn Val Val Ala Gln Ile Val Ile Trp Val Asn Leu Asn Leu
305 310 315 320
Trp Gln Lys Leu Lys Ile Gly Arg Asp Glu Ala Lys Pro Leu Gln Arg
325 330 335
Leu Lys Gly Phe Pro Ser Phe Pro Leu Val Glu Arg Gln Ala Asn Glu
340 345 350
Val Asp Trp Trp Asp Met Val Cys Asn Val Lys Lys Leu Ile Asn Glu
355 360 365
Lys Lys Glu Asp Gly Lys Val Phe Trp Gln Asn Leu Ala Gly Tyr Lys
370 375 380
Arg Gln Glu Ala Leu Arg Pro Tyr Leu Ser Ser Glu Glu Asp Arg Lys
385 390 395 400
Lys Gly Lys Lys Phe Ala Arg Tyr Gln Leu Gly Asp Leu Leu Leu His
405 410 415
Leu Glu Lys Lys His Gly Glu Asp Trp Gly Lys Val Tyr Asp Glu Ala
420 425 430
Trp Glu Arg Ile Asp Lys Lys Val Glu Gly Leu Ser Lys His Ile Lys
435 440 445
Leu Glu Glu Glu Arg Arg Ser Glu Asp Ala Gln Ser Lys Ala Ala Leu
450 455 460
Thr Asp Trp Leu Arg Ala Lys Ala Ser Phe Val Ile Glu Gly Leu Lys
465 470 475 480
Glu Ala Asp Lys Asp Glu Phe Cys Arg Cys Glu Leu Lys Leu Gln Lys
485 490 495
Trp Tyr Gly Asp Leu Arg Gly Lys Pro Phe Ala Ile Glu Ala Glu Asn
500 505 510
Ser Ile Leu Asp Ile Ser Gly Phe Ser Lys Gln Tyr Asn Cys Ala Phe
515 520 525
Ile Trp Gln Lys Asp Gly Val Lys Lys Leu Asn Leu Tyr Leu Ile Ile
530 535 540
Asn Tyr Phe Lys Gly Gly Lys Leu Arg Phe Lys Lys Ile Lys Pro Glu
545 550 555 560
Ala Phe Glu Ala Asn Arg Phe Tyr Thr Val Ile Asn Lys Lys Ser Gly
565 570 575
Glu Ile Val Pro Met Glu Val Asn Phe Asn Phe Asp Asp Pro Asn Leu
580 585 590
Ile Ile Leu Pro Leu Ala Phe Gly Lys Arg Gln Gly Arg Glu Phe Ile
595 600 605
Trp Asn Asp Leu Leu Ser Leu Glu Thr Gly Ser Leu Lys Leu Ala Asn
610 615 620
Gly Arg Val Ile Glu Lys Thr Leu Tyr Asn Arg Arg Thr Arg Gln Asp
625 630 635 640
Glu Pro Ala Leu Phe Val Ala Leu Thr Phe Glu Arg Arg Glu Val Leu
645 650 655
Asp Ser Ser Asn Ile Lys Pro Met Asn Leu Ile Gly Val Asp Arg Gly
660 665 670
Glu Asn Ile Pro Ala Val Ile Ala Leu Thr Asp Pro Glu Gly Cys Pro
675 680 685
Leu Ser Arg Phe Lys Asp Ser Leu Gly Asn Pro Thr His Ile Leu Arg
690 695 700
Ile Gly Glu Ser Tyr Lys Glu Lys Gln Arg Thr Ile Gln Ala Lys Lys
705 710 715 720
Glu Val Glu Gln Arg Arg Ala Gly Gly Tyr Ser Arg Lys Tyr Ala Ser
725 730 735
Lys Ala Lys Asn Leu Ala Asp Asp Met Val Arg Asn Thr Ala Arg Asp
740 745 750
Leu Leu Tyr Tyr Ala Val Thr Gln Asp Ala Met Leu Ile Phe Glu Asn
755 760 765
Leu Ser Arg Gly Phe Gly Arg Gln Gly Lys Arg Thr Phe Met Ala Glu
770 775 780
Arg Gln Tyr Thr Arg Met Glu Asp Trp Leu Thr Ala Lys Leu Ala Tyr
785 790 795 800
Glu Gly Leu Ser Lys Thr Tyr Leu Ser Lys Thr Leu Ala Gln Tyr Thr
805 810 815
Ser Lys Thr Cys Ser Asn Cys Gly Phe Thr Ile Thr Ser Ala Asp Tyr
820 825 830
Asp Arg Val Leu Glu Lys Leu Lys Lys Thr Ala Thr Gly Trp Met Thr
835 840 845
Thr Ile Asn Gly Lys Glu Leu Lys Val Glu Gly Gln Ile Thr Tyr Tyr
850 855 860
Asn Arg Tyr Lys Arg Gln Asn Val Val Lys Asp Leu Ser Val Glu Leu
865 870 875 880
Asp Arg Leu Ser Glu Glu Ser Val Asn Asn Asp Ile Ser Ser Trp Thr
885 890 895
Lys Gly Arg Ser Gly Glu Ala Leu Ser Leu Leu Lys Lys Arg Phe Ser
900 905 910
His Arg Pro Val Gln Glu Lys Phe Val Cys Leu Asn Cys Gly Phe Glu
915 920 925
Thr His Ala Asp Glu Gln Ala Ala Leu Asn Ile Ala Arg Ser Trp Leu
930 935 940
Phe Leu Arg Ser Gln Glu Tyr Lys Lys Tyr Gln Thr Asn Lys Thr Thr
945 950 955 960
Gly Asn Thr Asp Lys Arg Ala Phe Val Glu Thr Trp Gln Ser Phe Tyr
965 970 975
Arg Lys Lys Leu Lys Glu Val Trp Lys Pro Ala Val Thr Ser Pro Lys
980 985 990
Lys Lys Arg Lys Val
995
<210> 398
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<223> T7 promoter primer
<400> 398
gaaattaata cgactcacta ta 22
<210> 399
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> sg2 backbone fwd
<400> 399
gaaattaata cgactcacta taggtactgg cgcttttatc tcattacttt gagagccatc 60
accagcgact atgtcgtatg ggtaaag 87
<210> 400
<211> 78
<212> DNA
<213> Artificial Sequence
<220>
<223> sg2 backbone rev
<400> 400
ctttgatgct tcttatttat cggatttctc tccgataaat aagcgcttta cccatacgac 60
atagtcgctg gtgatggc 78
<210> 401
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> sg2.7.37 spacer primer
<400> 401
cggagcgaga catctcggcc ctttgatgct tcttatttat cggatttctc tccg 54
<210> 402
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> sg32 backbone fwd
<400> 402
gaaattaata cgactcacta taggtactgg cgcttttatc tcattacttt gagagccatc 60
accagcgact atgtcgtatg ggtaaagcgc 90
<210> 403
<211> 46
<212> DNA
<213> Artificial Sequence
<220>
<223> sg32 backbone rev
<400> 403
ctttgatgct tccctccgaa gagggcgctt tacccatacg acatag 46
<210> 404
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> sg32.7.37 spacer primer
<400> 404
cggagcgaga catctcggcc ctttgatgct tccctccgaa gag 43
<210> 405
<211> 90
<212> DNA
<213> Artificial Sequence
<220>
<223> sg64 backbone fwd
<400> 405
gaaattaata cgactcacta taggtactgg cgcctttatc tcattacttt gagagccatc 60
accagcgact atgtcgtatg ggtaaagcgc 90
<210> 406
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> sg64 backbone rev
<400> 406
ctttgatgct tcttacggac cgaagtccgt aagcgcttta cccatacgac atag 54
<210> 407
<211> 45
<212> DNA
<213> Artificial Sequence
<220>
<223> sg64.7.37 spacer primer
<400> 407
cggagcgaga catctcggcc ctttgatgct tcttacggac cgaag 45
<210> 408
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<223> sg174 backbone fwd
<400> 408
gaaattaata cgactcacta taactggcgc ttttatctga ttactttgag agccatcacc 60
agcgactatg tcgtagtggg taaagct 87
<210> 409
<211> 50
<212> DNA
<213> Artificial Sequence
<220>
<223> sg174 backbone rev
<400> 409
ctttgatgct ccctccgaag agggagcttt acccactacg acatagtcgc 50
<210> 410
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> sg174.7.37 spacer primer
<400> 410
cggagcgaga catctcggcc ctttgatgct ccctcc 36
<210> 411
<211> 130
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 411
gguacuggcg cuuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg 60
uaaagcgcuu auuuaucgga gagaaauccg auaaauaaga agcaucaaag ggccgagaug 120
ucucgcuccg 130
<210> 412
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 412
gguacuggcg cuuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg 60
uaaagcgccc ucuucggagg gaagcaucaa agggccgaga ugucucg 107
<210> 413
<211> 120
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 413
gguacuggcg ccuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg 60
uaaagcgcuu acggacuucg guccguaaga agcaucaaag ggccgagaug ucucgcuccg 120
<210> 414
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gRNA sequence
<400> 414
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaagg gccgagaugu cucgcuccg 109
<210> 415
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target oligo
<400> 415
tgaagctgac agcattcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60
<210> 416
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target oligo
<400> 416
tgaagctgac agcattcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60
<210> 417
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 417
agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgaatgct gtcagcttca 60
<210> 418
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 418
tgaagctgac agcattcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60
<210> 419
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 419
agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgagtgct gtcagcttca 60
<210> 420
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 420
tgaagctgac agcactcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60
<210> 421
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 421
agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgactgct gtcagcttca 60
<210> 422
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 422
tgaagctgac agcagtcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60
<210> 423
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 423
agcgcgagca cagctaaggc cacggagcga gacatctcgg cccgattgct gtcagcttca 60
<210> 424
<211> 60
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA target sequence
<400> 424
tgaagctgac agcaatcggg ccgagatgtc tcgctccgtg gccttagctg tgctcgcgct 60
<210> 425
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA spacer sequence
<400> 425
ctgcattcta gttgtggttt 20
<210> 426
<211> 109
<212> DNA
<213> Artificial Sequence
<220>
<223> gRNA plasmid sequence
<400> 426
actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc gtagtgggta 60
aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggttt 109
<210> 427
<211> 4557
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP10 plasmid
<400> 427
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc 1920
aacgagagac tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg 1980
tacaagctgg aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc 2040
aacgtgtccg agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat 2100
gagctggtca catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc 2160
cacgtgacca gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc 2220
tgtgcctctg gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc 2280
ttcctgacca agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag 2340
aaaagactgg ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc 2400
accctgcctc cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc 2460
cagatcgtga tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa 2520
gccaagccac tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc 2760
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac 3540
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4140
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557
<210> 428
<211> 4557
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP11 plasmid
<400> 428
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc 1920
aacgagagac tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg 1980
tacaagctgg aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc 2040
aacgtgtccg agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat 2100
gagctggtca catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc 2160
cacgtgacca gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc 2220
tgtgcctctg gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc 2280
ttcctgacca agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag 2340
aaaagactgg ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc 2400
accctgcctc cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc 2460
cagatcgtga tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa 2520
gccaagccac tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760
ggcgacctgc tgaagcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggag gaagaggcag 4140
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557
<210> 429
<211> 4557
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP12 plasmid
<400> 429
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc 1920
aacgagagac tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg 1980
tacaagctgg aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc 2040
aacgtgtccg agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat 2100
gagctggtca catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc 2160
cacgtgacca gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc 2220
tgtgcctctg gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc 2280
ttcctgacca agtaccagga catcatcctg gaacacaaga aagtgatcaa gaagaacgag 2340
aaaagactgg ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc 2400
accctgcctc cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc 2460
cagatcgtga tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa 2520
gccaagccac tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700
ccttacctga gcagccccga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420
cccctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggag gaagaggcag 4140
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557
<210> 430
<211> 4620
<212> DNA
<213> Artificial Sequence
<220>
<223> psPax2 plasmid sequence
<400> 430
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccagta aaattaaagc 1800
caggaatgga tggcccaaaa gttaaacaat ggccattgac agaagaaaaa ataaaagcat 1860
tagtagaaat ttgtacagaa atggaaaagg aaggaaaaat ttcaaaaatt gggcctgaaa 1920
atccatacaa tactccagta tttgccataa agaaaaaaga cagtactaaa tggagaaaat 1980
tagtagattt cagagaactt aataagagaa ctcaagattt ctgggaagtt caattaggaa 2040
taccacatcc tgcagggtta aaacagaaaa aatcagtaac agtactggat gtgggcgatg 2100
catatttttc agttccctta gataaagact tcaggaagta tactgcattt accataccta 2160
gtataaacaa tgagacacca gggattagat atcagtacaa tgtgcttcca cagggatgga 2220
aaggatcacc agcaatattc cagtgtagca tgacaaaaat cttagagcct tttagaaaac 2280
aaaatccaga catagtcatc tatcaataca tggatgattt gtatgtagga tctgacttag 2340
aaatagggca gcatagaaca aaaatagagg aactgagaca acatctgttg aggtggggat 2400
ttaccacacc agacaaaaaa catcagaaag aacctccatt cctttggatg ggttatgaac 2460
tccatcctga taaatggaca gtacagccta tagtgctgcc agaaaaggac agctggactg 2520
tcaatgacat acagaaatta gtgggaaaat tgaattgggc aagtcagatt tatgcaggga 2580
ttaaagtaag gcaattatgt aaacttctta ggggaaccaa agcactaaca gaagtagtac 2640
cactaacaga agaagcagag ctagaactgg cagaaaacag ggagattcta aaagaaccgg 2700
tacatggagt gtattatgac ccatcaaaag acttaatagc agaaatacag aagcaggggc 2760
aaggccaatg gacatatcaa atttatcaag agccatttaa aaatctgaaa acaggaaagt 2820
atgcaagaat gaagggtgcc cacactaatg atgtgaaaca attaacagag gcagtacaaa 2880
aaatagccac agaaagcata gtaatatggg gaaagactcc taaatttaaa ttacccatac 2940
aaaaggaaac atgggaagca tggtggacag agtattggca agccacctgg attcctgagt 3000
gggagtttgt caatacccct cccttagtga agttatggta ccagttagag aaagaaccca 3060
taataggagc agaaactttc tatgtagatg gggcagccaa tagggaaact aaattaggaa 3120
aagcaggata tgtaactgac agaggaagac aaaaagttgt ccccctaacg gacacaacaa 3180
atcagaagac tgagttacaa gcaattcatc tagctttgca ggattcggga ttagaagtaa 3240
acatagtgac agactcacaa tatgcattgg gaatcattca agcacaacca gataagagtg 3300
aatcagagtt agtcagtcaa ataatagagc agttaataaa aaaggaaaaa gtctacctgg 3360
catgggtacc agcacacaaa ggaattggag gaaatgaaca agtagataaa ttggtcagtg 3420
ctggaatcag gaaagtacta tttttagatg gaatagataa ggcccaagaa gaacatgaga 3480
aatatcacag taattggaga gcaatggcta gtgattttaa cctaccacct gtagtagcaa 3540
aagaaatagt agccagctgt gataaatgtc agctaaaagg ggaagccatg catggacaag 3600
tagactgtag cccaggaata tggcagctag attgtacaca tttagaagga aaagttatct 3660
tggtagcagt tcatgtagcc agtggatata tagaagcaga agtaattcca gcagagacag 3720
ggcaagaaac agcatacttc ctcttaaaat tagcaggaag atggccagta aaaacagtac 3780
atacagacaa tggcagcaat ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg 3840
ggatcaagca ggaatttggc attccctaca atccccaaag tcaaggagta atagaatcta 3900
tgaataaaga attaaagaaa attataggac aggtaagaga tcaggctgaa catcttaaga 3960
cagcagtaca aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt 4020
acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac 4080
aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag 4140
tttggaaagg accagcaaag ctcctctgga aaggtgaagg ggcagtagta atacaagata 4200
atagtgacat aaaagtagtg ccaagaagaa aagcaaagat catcagggat tatggaaaac 4260
agatggcagg tgatgattgt gtggcaagta gacaggatga ggattaacac atggaattct 4320
gcaacaactg ctgtttatcc atttcagaat tgggtgtcga catagcagaa taggcgttac 4380
tcgacagagg agagcaagaa atggagccag tagatcctag actagagccc tggaagcatc 4440
caggaagtca gcctaaaact gcttgtacca attgctattg taaaaagtgt tgctttcatt 4500
gccaagtttg tttcatgaca aaagccttag gcatctccta tggcaggaag aagcggagac 4560
agcgacgaag agctcatcag aacagtcaga ctcatcaagc ttctctatca aagcagtaag 4620
<210> 431
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 plasmid sequence
<400> 431
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 432
<211> 4563
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid Sequence
<400> 432
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tga 4563
<210> 433
<211> 4620
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-(-1)-POL plasmid sequence
<400> 433
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccagta aaattaaagc 1800
caggaatgga tggcccaaaa gttaaacaat ggccattgac agaagaaaaa ataaaagcat 1860
tagtagaaat ttgtacagaa atggaaaagg aaggaaaaat ttcaaaaatt gggcctgaaa 1920
atccatacaa tactccagta tttgccataa agaaaaaaga cagtactaaa tggagaaaat 1980
tagtagattt cagagaactt aataagagaa ctcaagattt ctgggaagtt caattaggaa 2040
taccacatcc tgcagggtta aaacagaaaa aatcagtaac agtactggat gtgggcgatg 2100
catatttttc agttccctta gataaagact tcaggaagta tactgcattt accataccta 2160
gtataaacaa tgagacacca gggattagat atcagtacaa tgtgcttcca cagggatgga 2220
aaggatcacc agcaatattc cagtgtagca tgacaaaaat cttagagcct tttagaaaac 2280
aaaatccaga catagtcatc tatcaataca tggatgattt gtatgtagga tctgacttag 2340
aaatagggca gcatagaaca aaaatagagg aactgagaca acatctgttg aggtggggat 2400
ttaccacacc agacaaaaaa catcagaaag aacctccatt cctttggatg ggttatgaac 2460
tccatcctga taaatggaca gtacagccta tagtgctgcc agaaaaggac agctggactg 2520
tcaatgacat acagaaatta gtgggaaaat tgaattgggc aagtcagatt tatgcaggga 2580
ttaaagtaag gcaattatgt aaacttctta ggggaaccaa agcactaaca gaagtagtac 2640
cactaacaga agaagcagag ctagaactgg cagaaaacag ggagattcta aaagaaccgg 2700
tacatggagt gtattatgac ccatcaaaag acttaatagc agaaatacag aagcaggggc 2760
aaggccaatg gacatatcaa atttatcaag agccatttaa aaatctgaaa acaggaaagt 2820
atgcaagaat gaagggtgcc cacactaatg atgtgaaaca attaacagag gcagtacaaa 2880
aaatagccac agaaagcata gtaatatggg gaaagactcc taaatttaaa ttacccatac 2940
aaaaggaaac atgggaagca tggtggacag agtattggca agccacctgg attcctgagt 3000
gggagtttgt caatacccct cccttagtga agttatggta ccagttagag aaagaaccca 3060
taataggagc agaaactttc tatgtagatg gggcagccaa tagggaaact aaattaggaa 3120
aagcaggata tgtaactgac agaggaagac aaaaagttgt ccccctaacg gacacaacaa 3180
atcagaagac tgagttacaa gcaattcatc tagctttgca ggattcggga ttagaagtaa 3240
acatagtgac agactcacaa tatgcattgg gaatcattca agcacaacca gataagagtg 3300
aatcagagtt agtcagtcaa ataatagagc agttaataaa aaaggaaaaa gtctacctgg 3360
catgggtacc agcacacaaa ggaattggag gaaatgaaca agtagataaa ttggtcagtg 3420
ctggaatcag gaaagtacta tttttagatg gaatagataa ggcccaagaa gaacatgaga 3480
aatatcacag taattggaga gcaatggcta gtgattttaa cctaccacct gtagtagcaa 3540
aagaaatagt agccagctgt gataaatgtc agctaaaagg ggaagccatg catggacaag 3600
tagactgtag cccaggaata tggcagctag attgtacaca tttagaagga aaagttatct 3660
tggtagcagt tcatgtagcc agtggatata tagaagcaga agtaattcca gcagagacag 3720
ggcaagaaac agcatacttc ctcttaaaat tagcaggaag atggccagta aaaacagtac 3780
atacagacaa tggcagcaat ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg 3840
ggatcaagca ggaatttggc attccctaca atccccaaag tcaaggagta atagaatcta 3900
tgaataaaga attaaagaaa attataggac aggtaagaga tcaggctgaa catcttaaga 3960
cagcagtaca aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt 4020
acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac 4080
aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag 4140
tttggaaagg accagcaaag ctcctctgga aaggtgaagg ggcagtagta atacaagata 4200
atagtgacat aaaagtagtg ccaagaagaa aagcaaagat catcagggat tatggaaaac 4260
agatggcagg tgatgattgt gtggcaagta gacaggatga ggattaacac atggaattct 4320
gcaacaactg ctgtttatcc atttcagaat tgggtgtcga catagcagaa taggcgttac 4380
tcgacagagg agagcaagaa atggagccag tagatcctag actagagccc tggaagcatc 4440
caggaagtca gcctaaaact gcttgtacca attgctattg taaaaagtgt tgctttcatt 4500
gccaagtttg tttcatgaca aaagccttag gcatctccta tggcaggaag aagcggagac 4560
agcgacgaag agctcatcag aacagtcaga ctcatcaagc ttctctatca aagcagtaag 4620
<210> 434
<211> 4560
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 434
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
<210> 435
<211> 4869
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X-PR plasmid sequence
<400> 435
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620
gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680
aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740
agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800
gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860
ttaaatttt 4869
<210> 436
<211> 4563
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 436
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tga 4563
<210> 437
<211> 1536
<212> DNA
<213> Vesiculovirus Vesicular stomatitis virus
<400> 437
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 438
<211> 511
<212> PRT
<213> Vesiculovirus Vesicular stomatitis virus
<400> 438
Met Lys Cys Leu Leu Tyr Leu Ala Phe Leu Phe Ile Gly Val Asn Cys
1 5 10 15
Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys Asn
20 25 30
Val Pro Ser Asn Tyr His Tyr Cys Pro Ser Ser Ser Asp Leu Asn Trp
35 40 45
His Asn Asp Leu Ile Gly Thr Ala Leu Gln Val Lys Met Pro Lys Ser
50 55 60
His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ser Lys Trp
65 70 75 80
Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His
85 90 95
Ser Ile Arg Ser Phe Thr Pro Ser Val Glu Gln Cys Lys Glu Ser Ile
100 105 110
Glu Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro Gln
115 120 125
Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Ala Val Ile Val Gln
130 135 140
Val Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Val
145 150 155 160
Asp Ser Gln Phe Ile Asn Gly Lys Cys Ser Asn Tyr Ile Cys Pro Thr
165 170 175
Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Lys Gly Leu
180 185 190
Cys Asp Ser Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu Asp
195 200 205
Gly Glu Leu Ser Ser Leu Gly Lys Glu Gly Thr Gly Phe Arg Ser Asn
210 215 220
Tyr Phe Ala Tyr Glu Thr Gly Gly Lys Ala Cys Lys Met Gln Tyr Cys
225 230 235 240
Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met Ala
245 250 255
Asp Lys Asp Leu Phe Ala Ala Ala Arg Phe Pro Glu Cys Pro Glu Gly
260 265 270
Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile
275 280 285
Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp
290 295 300
Ser Lys Ile Arg Ala Gly Leu Pro Ile Ser Pro Val Asp Leu Ser Tyr
305 310 315 320
Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile Asn
325 330 335
Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ala
340 345 350
Ala Pro Ile Leu Ser Arg Met Val Gly Met Ile Ser Gly Thr Thr Thr
355 360 365
Glu Arg Glu Leu Trp Asp Asp Trp Ala Pro Tyr Glu Asp Val Glu Ile
370 375 380
Gly Pro Asn Gly Val Leu Arg Thr Ser Ser Gly Tyr Lys Phe Pro Leu
385 390 395 400
Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Leu Ser Ser
405 410 415
Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser Gln
420 425 430
Leu Pro Asp Asp Glu Ser Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys
435 440 445
Asn Pro Ile Glu Leu Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Ser
450 455 460
Ile Ala Ser Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu
465 470 475 480
Val Leu Arg Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys
485 490 495
Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
500 505 510
<210> 439
<211> 1536
<212> DNA
<213> Lentivirus Human immunodeficiency virus
<400> 439
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 440
<211> 511
<212> PRT
<213> Lentivirus Human immunodeficiency virus
<400> 440
Met Lys Cys Leu Leu Tyr Leu Ala Phe Leu Phe Ile Gly Val Asn Cys
1 5 10 15
Lys Phe Thr Ile Val Phe Pro His Asn Gln Lys Gly Asn Trp Lys Asn
20 25 30
Val Pro Ser Asn Tyr His Tyr Cys Pro Ser Ser Ser Asp Leu Asn Trp
35 40 45
His Asn Asp Leu Ile Gly Thr Ala Leu Gln Val Lys Met Pro Lys Ser
50 55 60
His Lys Ala Ile Gln Ala Asp Gly Trp Met Cys His Ala Ser Lys Trp
65 70 75 80
Val Thr Thr Cys Asp Phe Arg Trp Tyr Gly Pro Lys Tyr Ile Thr His
85 90 95
Ser Ile Arg Ser Phe Thr Pro Ser Val Glu Gln Cys Lys Glu Ser Ile
100 105 110
Glu Gln Thr Lys Gln Gly Thr Trp Leu Asn Pro Gly Phe Pro Pro Gln
115 120 125
Ser Cys Gly Tyr Ala Thr Val Thr Asp Ala Glu Ala Val Ile Val Gln
130 135 140
Val Thr Pro His His Val Leu Val Asp Glu Tyr Thr Gly Glu Trp Val
145 150 155 160
Asp Ser Gln Phe Ile Asn Gly Lys Cys Ser Asn Tyr Ile Cys Pro Thr
165 170 175
Val His Asn Ser Thr Thr Trp His Ser Asp Tyr Lys Val Lys Gly Leu
180 185 190
Cys Asp Ser Asn Leu Ile Ser Met Asp Ile Thr Phe Phe Ser Glu Asp
195 200 205
Gly Glu Leu Ser Ser Leu Gly Lys Glu Gly Thr Gly Phe Arg Ser Asn
210 215 220
Tyr Phe Ala Tyr Glu Thr Gly Gly Lys Ala Cys Lys Met Gln Tyr Cys
225 230 235 240
Lys His Trp Gly Val Arg Leu Pro Ser Gly Val Trp Phe Glu Met Ala
245 250 255
Asp Lys Asp Leu Phe Ala Ala Ala Arg Phe Pro Glu Cys Pro Glu Gly
260 265 270
Ser Ser Ile Ser Ala Pro Ser Gln Thr Ser Val Asp Val Ser Leu Ile
275 280 285
Gln Asp Val Glu Arg Ile Leu Asp Tyr Ser Leu Cys Gln Glu Thr Trp
290 295 300
Ser Lys Ile Arg Ala Gly Leu Pro Ile Ser Pro Val Asp Leu Ser Tyr
305 310 315 320
Leu Ala Pro Lys Asn Pro Gly Thr Gly Pro Ala Phe Thr Ile Ile Asn
325 330 335
Gly Thr Leu Lys Tyr Phe Glu Thr Arg Tyr Ile Arg Val Asp Ile Ala
340 345 350
Ala Pro Ile Leu Ser Arg Met Val Gly Met Ile Ser Gly Thr Thr Thr
355 360 365
Glu Arg Glu Leu Trp Asp Asp Trp Ala Pro Tyr Glu Asp Val Glu Ile
370 375 380
Gly Pro Asn Gly Val Leu Arg Thr Ser Ser Gly Tyr Lys Phe Pro Leu
385 390 395 400
Tyr Met Ile Gly His Gly Met Leu Asp Ser Asp Leu His Leu Ser Ser
405 410 415
Lys Ala Gln Val Phe Glu His Pro His Ile Gln Asp Ala Ala Ser Gln
420 425 430
Leu Pro Asp Asp Glu Ser Leu Phe Phe Gly Asp Thr Gly Leu Ser Lys
435 440 445
Asn Pro Ile Glu Leu Val Glu Gly Trp Phe Ser Ser Trp Lys Ser Ser
450 455 460
Ile Ala Ser Phe Phe Phe Ile Ile Gly Leu Ile Ile Gly Leu Phe Leu
465 470 475 480
Val Leu Arg Val Gly Ile His Leu Cys Ile Lys Leu Lys His Thr Lys
485 490 495
Lys Arg Gln Ile Tyr Thr Asp Ile Glu Met Asn Arg Leu Gly Lys
500 505 510
<210> 441
<211> 2571
<212> DNA
<213> Alpharetrovirus Avian leukosis virus
<400> 441
atgagagtga aggagaaata tcagcacttg tggagatggg ggtggagatg gggcaccatg 60
ctccttggga tgttgatgat ctgtagtgct acagaaaaat tgtgggtcac agtctattat 120
ggggtacctg tgtggaagga agcaaccacc actctatttt gtgcatcaga tgctaaagca 180
tatgatacag aggtacataa tgtttgggcc acacatgcct gtgtacccac agaccccaac 240
ccacaagaag tagtattggt aaatgtgaca gaaaatttta acatgtggaa aaatgacatg 300
gtagaacaga tgcatgagga tataatcagt ttatgggatc aaagcctaaa gccatgtgta 360
aaattaaccc cactctgtgt tagtttaaag tgcactgatt tgaagaatga tactaatacc 420
aatagtagta gcgggagaat gataatggag aaaggagaga taaaaaactg ctctttcaat 480
atcagcacaa gcataagagg taaggtgcag aaagaatatg cattttttta taaacttgat 540
ataataccaa tagataatga tactaccagc tataagttga caagttgtaa cacctcagtc 600
attacacagg cctgtccaaa ggtatccttt gagccaattc ccatacatta ttgtgccccg 660
gctggttttg cgattctaaa atgtaataat aagacgttca atggaacagg accatgtaca 720
aatgtcagca cagtacaatg tacacatgga attaggccag tagtatcaac tcaactgctg 780
ttaaatggca gtctagcaga agaagaggta gtaattagat ctgtcaattt cacggacaat 840
gctaaaacca taatagtaca gctgaacaca tctgtagaaa ttaattgtac aagacccaac 900
aacaatacaa gaaaaagaat ccgtatccag agaggaccag ggagagcatt tgttacaata 960
ggaaaaatag gaaatatgag acaagcacat tgtaacatta gtagagcaaa atggaataac 1020
actttaaaac agatagctag caaattaaga gaacaatttg gaaataataa aacaataatc 1080
tttaagcaat cctcaggagg ggacccagaa attgtaacgc acagttttaa ttgtggaggg 1140
gaatttttct actgtaattc aacacaactg tttaatagta cttggtttaa tagtacttgg 1200
agtactgaag ggtcaaataa cactgaagga agtgacacaa tcaccctccc atgcagaata 1260
aaacaaatta taaacatgtg gcagaaagta ggaaaagcaa tgtatgcccc tcccatcagt 1320
ggacaaatta gatgttcatc aaatattaca gggctgctat taacaagaga tggtggtaat 1380
agcaacaatg agtccgagat cttcagacct ggaggaggag atatgaggga caattggaga 1440
agtgaattat ataaatataa agtagtaaaa attgaaccat taggagtagc acccaccaag 1500
gcaaagagaa gagtggtgca gagagaaaaa agagcagtgg gaataggagc tttgttcctt 1560
gggttcttgg gagcagcagg aagcactatg ggcgcagcct caatgacgct gacggtacag 1620
gccagacaat tattgtctgg tatagtgcag cagcagaaca atttgctgag ggctattgag 1680
gcgcaacagc atctgttgca actcacagtc tggggcatca agcagctcca ggcaagaatc 1740
ctggctgtgg aaagatacct aaaggatcaa cagctcctgg ggatttgggg ttgctctgga 1800
aaactcattt gcaccactgc tgtgccttgg aatgctagtt ggagtaataa atctctggaa 1860
cagatttgga atcacacgac ctggatggag tgggacagag aaattaacaa ttacacaagc 1920
ttaatacact ccttaattga agaatcgcaa aaccagcaag aaaagaatga acaagaatta 1980
ttggaattag ataaatgggc aagtttgtgg aattggttta acataacaaa ttggctgtgg 2040
tatataaaat tattcataat gatagtagga ggcttggtag gtttaagaat agtttttgct 2100
gtactttcta tagtgaatag agttaggcag ggatattcac cattatcgtt tcagacccac 2160
ctcccaaccc cgaggggacc cgacaggccc gaaggaatag aagaagaagg tggagagaga 2220
gacagagaca gatccattcg attagtgaac ggatccttgg cacttatctg ggacgatctg 2280
cggagcctgt gcctcttcag ctaccaccgc ttgagagact tactcttgat tgtaacgagg 2340
attgtggaac ttctgggacg cagggggtgg gaagccctca aatattggtg gaatctccta 2400
cagtattgga gtcaggaact aaagaatagt gctgttagct tgctcaatgc cacagccata 2460
gcagtagctg aggggacaga tagggttata gaagtagtac aaggagcttg tagagctatt 2520
cgccacatac ctagaagaat aagacagggc ttggaaagga ttttgctata a 2571
<210> 442
<211> 856
<212> PRT
<213> Alpharetrovirus Avian leukosis virus
<400> 442
Met Arg Val Lys Glu Lys Tyr Gln His Leu Trp Arg Trp Gly Trp Arg
1 5 10 15
Trp Gly Thr Met Leu Leu Gly Met Leu Met Ile Cys Ser Ala Thr Glu
20 25 30
Lys Leu Trp Val Thr Val Tyr Tyr Gly Val Pro Val Trp Lys Glu Ala
35 40 45
Thr Thr Thr Leu Phe Cys Ala Ser Asp Ala Lys Ala Tyr Asp Thr Glu
50 55 60
Val His Asn Val Trp Ala Thr His Ala Cys Val Pro Thr Asp Pro Asn
65 70 75 80
Pro Gln Glu Val Val Leu Val Asn Val Thr Glu Asn Phe Asn Met Trp
85 90 95
Lys Asn Asp Met Val Glu Gln Met His Glu Asp Ile Ile Ser Leu Trp
100 105 110
Asp Gln Ser Leu Lys Pro Cys Val Lys Leu Thr Pro Leu Cys Val Ser
115 120 125
Leu Lys Cys Thr Asp Leu Lys Asn Asp Thr Asn Thr Asn Ser Ser Ser
130 135 140
Gly Arg Met Ile Met Glu Lys Gly Glu Ile Lys Asn Cys Ser Phe Asn
145 150 155 160
Ile Ser Thr Ser Ile Arg Gly Lys Val Gln Lys Glu Tyr Ala Phe Phe
165 170 175
Tyr Lys Leu Asp Ile Ile Pro Ile Asp Asn Asp Thr Thr Ser Tyr Lys
180 185 190
Leu Thr Ser Cys Asn Thr Ser Val Ile Thr Gln Ala Cys Pro Lys Val
195 200 205
Ser Phe Glu Pro Ile Pro Ile His Tyr Cys Ala Pro Ala Gly Phe Ala
210 215 220
Ile Leu Lys Cys Asn Asn Lys Thr Phe Asn Gly Thr Gly Pro Cys Thr
225 230 235 240
Asn Val Ser Thr Val Gln Cys Thr His Gly Ile Arg Pro Val Val Ser
245 250 255
Thr Gln Leu Leu Leu Asn Gly Ser Leu Ala Glu Glu Glu Val Val Ile
260 265 270
Arg Ser Val Asn Phe Thr Asp Asn Ala Lys Thr Ile Ile Val Gln Leu
275 280 285
Asn Thr Ser Val Glu Ile Asn Cys Thr Arg Pro Asn Asn Asn Thr Arg
290 295 300
Lys Arg Ile Arg Ile Gln Arg Gly Pro Gly Arg Ala Phe Val Thr Ile
305 310 315 320
Gly Lys Ile Gly Asn Met Arg Gln Ala His Cys Asn Ile Ser Arg Ala
325 330 335
Lys Trp Asn Asn Thr Leu Lys Gln Ile Ala Ser Lys Leu Arg Glu Gln
340 345 350
Phe Gly Asn Asn Lys Thr Ile Ile Phe Lys Gln Ser Ser Gly Gly Asp
355 360 365
Pro Glu Ile Val Thr His Ser Phe Asn Cys Gly Gly Glu Phe Phe Tyr
370 375 380
Cys Asn Ser Thr Gln Leu Phe Asn Ser Thr Trp Phe Asn Ser Thr Trp
385 390 395 400
Ser Thr Glu Gly Ser Asn Asn Thr Glu Gly Ser Asp Thr Ile Thr Leu
405 410 415
Pro Cys Arg Ile Lys Gln Ile Ile Asn Met Trp Gln Lys Val Gly Lys
420 425 430
Ala Met Tyr Ala Pro Pro Ile Ser Gly Gln Ile Arg Cys Ser Ser Asn
435 440 445
Ile Thr Gly Leu Leu Leu Thr Arg Asp Gly Gly Asn Ser Asn Asn Glu
450 455 460
Ser Glu Ile Phe Arg Pro Gly Gly Gly Asp Met Arg Asp Asn Trp Arg
465 470 475 480
Ser Glu Leu Tyr Lys Tyr Lys Val Val Lys Ile Glu Pro Leu Gly Val
485 490 495
Ala Pro Thr Lys Ala Lys Arg Arg Val Val Gln Arg Glu Lys Arg Ala
500 505 510
Val Gly Ile Gly Ala Leu Phe Leu Gly Phe Leu Gly Ala Ala Gly Ser
515 520 525
Thr Met Gly Ala Ala Ser Met Thr Leu Thr Val Gln Ala Arg Gln Leu
530 535 540
Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Leu Leu Arg Ala Ile Glu
545 550 555 560
Ala Gln Gln His Leu Leu Gln Leu Thr Val Trp Gly Ile Lys Gln Leu
565 570 575
Gln Ala Arg Ile Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu
580 585 590
Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val
595 600 605
Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn
610 615 620
His Thr Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser
625 630 635 640
Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn
645 650 655
Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp
660 665 670
Phe Asn Ile Thr Asn Trp Leu Trp Tyr Ile Lys Leu Phe Ile Met Ile
675 680 685
Val Gly Gly Leu Val Gly Leu Arg Ile Val Phe Ala Val Leu Ser Ile
690 695 700
Val Asn Arg Val Arg Gln Gly Tyr Ser Pro Leu Ser Phe Gln Thr His
705 710 715 720
Leu Pro Thr Pro Arg Gly Pro Asp Arg Pro Glu Gly Ile Glu Glu Glu
725 730 735
Gly Gly Glu Arg Asp Arg Asp Arg Ser Ile Arg Leu Val Asn Gly Ser
740 745 750
Leu Ala Leu Ile Trp Asp Asp Leu Arg Ser Leu Cys Leu Phe Ser Tyr
755 760 765
His Arg Leu Arg Asp Leu Leu Leu Ile Val Thr Arg Ile Val Glu Leu
770 775 780
Leu Gly Arg Arg Gly Trp Glu Ala Leu Lys Tyr Trp Trp Asn Leu Leu
785 790 795 800
Gln Tyr Trp Ser Gln Glu Leu Lys Asn Ser Ala Val Ser Leu Leu Asn
805 810 815
Ala Thr Ala Ile Ala Val Ala Glu Gly Thr Asp Arg Val Ile Glu Val
820 825 830
Val Gln Gly Ala Cys Arg Ala Ile Arg His Ile Pro Arg Arg Ile Arg
835 840 845
Gln Gly Leu Glu Arg Ile Leu Leu
850 855
<210> 443
<211> 1806
<212> DNA
<213> Alpharetrovirus Rous sarcoma virus
<400> 443
atggaagccg tcataaaggc atttctgact ggataccctg ggaagacgag caagaaggac 60
tccaaggaga aaccgctagc aacaagcaag aaagacccgg agaagacacc cttgctgcca 120
acgagagtta attatattct cattattggt gtcctggtct tgtgtgaggt tacgggggta 180
agagctgatg ttcacttact cgagcagcca gggaaccttt ggattacatg ggccaaccgt 240
acaggccaaa cggatttctg cctctctaca cagtcagcca cctccccttt tcaaacatgt 300
ttgataggta tcccgtctcc tatttccgaa ggtgatttta agggatatgt ttctgataca 360
aattgctcca ctgtgggaac tgaccggtta gtcttgtcag ccagcattac cggcggccct 420
gacaacagca ccaccctcac ttatcgaaag gtttcatgcc tgctgttaaa gctgaacgtc 480
tccatgtggg atgagccacc tgaactgcag ctgctaggtt cccagtctct ccctaacgtt 540
actaacatta ctcaggtctc tggcgtggcc gggggatgtg tatatttcgc cccaagggcc 600
actggcctgt ttttaggttg gtctaaacaa ggtctctcgc ggttcctcct ccgtcacccc 660
tttacctcca cctctaactc cacggaaccg ttcacggtgg tgacagcgga tagacacaat 720
ctttttatgg ggagtgagta ctgtggtgca tatggctaca gattttggga aatatataac 780
tgctcacaga ctaggaatac ttaccgctgt ggagacgtgg gaggtactgg cctccctgaa 840
acctggtgca gaggaaaagg aggtatatgg gttaatcaat caaaggaaat taatgagaca 900
gagccgttca gttttactgc gaactgtact ggcagtaatt tgggtaatgt cagcggatgt 960
tgcggagaac caatcacgat tctcccacta ggggcatgga tcgacagtac gcaaggtagt 1020
ttcactaaac caaaagcgct accacccgca attttcctca tttgtgggga tcgcgcatgg 1080
caaggaattc ccagtcgtcc ggtagggggc ccctgctatt taggcaagct taccatgtta 1140
gcacccaacc atacagatat tctcaaaata cttgctaatt cgtcgcggac aggtataaga 1200
cgtaaacgaa gcgtctcaca cctggatgat acatgctcag atgaagtaca gctttggggt 1260
cctacagcaa gaatctttgc atctatctta gccccggggg tagcagctgc gcaagcctta 1320
agagaaattg agagactagc ctgttggtcc gttaaacagg ctaacttgac aacatcactc 1380
ctcggggact tattggatga tgtcacgagt attcgacacg cggtcctgca gaaccgagcg 1440
gctattgact tcttgcttct agctcacggc catggctgtg aggacgttgc cggaatgtgt 1500
tgtttcaatc tgagtgatca cagtgaatct atacagaaga agttccagct aatgaagaaa 1560
catgtcaata agatcggcgt ggacagcgac ccaatcggaa gttggctgcg agggatattc 1620
gggggaatag gggaatgggc cgttcatctg ctaaaaggac tgcttttggg gcttgtagtt 1680
attttattgc tactggtgtg cctgccttgc cttttacaat ttgtgtctag tagtattcga 1740
aagatgatta atagttcaat caactatcat actgaataca ggaagatgca gggcggagca 1800
gtctag 1806
<210> 444
<211> 601
<212> PRT
<213> Alpharetrovirus Rous sarcoma virus
<400> 444
Met Glu Ala Val Ile Lys Ala Phe Leu Thr Gly Tyr Pro Gly Lys Thr
1 5 10 15
Ser Lys Lys Asp Ser Lys Glu Lys Pro Leu Ala Thr Ser Lys Lys Asp
20 25 30
Pro Glu Lys Thr Pro Leu Leu Pro Thr Arg Val Asn Tyr Ile Leu Ile
35 40 45
Ile Gly Val Leu Val Leu Cys Glu Val Thr Gly Val Arg Ala Asp Val
50 55 60
His Leu Leu Glu Gln Pro Gly Asn Leu Trp Ile Thr Trp Ala Asn Arg
65 70 75 80
Thr Gly Gln Thr Asp Phe Cys Leu Ser Thr Gln Ser Ala Thr Ser Pro
85 90 95
Phe Gln Thr Cys Leu Ile Gly Ile Pro Ser Pro Ile Ser Glu Gly Asp
100 105 110
Phe Lys Gly Tyr Val Ser Asp Thr Asn Cys Ser Thr Val Gly Thr Asp
115 120 125
Arg Leu Val Leu Ser Ala Ser Ile Thr Gly Gly Pro Asp Asn Ser Thr
130 135 140
Thr Leu Thr Tyr Arg Lys Val Ser Cys Leu Leu Leu Lys Leu Asn Val
145 150 155 160
Ser Met Trp Asp Glu Pro Pro Glu Leu Gln Leu Leu Gly Ser Gln Ser
165 170 175
Leu Pro Asn Val Thr Asn Ile Thr Gln Val Ser Gly Val Ala Gly Gly
180 185 190
Cys Val Tyr Phe Ala Pro Arg Ala Thr Gly Leu Phe Leu Gly Trp Ser
195 200 205
Lys Gln Gly Leu Ser Arg Phe Leu Leu Arg His Pro Phe Thr Ser Thr
210 215 220
Ser Asn Ser Thr Glu Pro Phe Thr Val Val Thr Ala Asp Arg His Asn
225 230 235 240
Leu Phe Met Gly Ser Glu Tyr Cys Gly Ala Tyr Gly Tyr Arg Phe Trp
245 250 255
Glu Ile Tyr Asn Cys Ser Gln Thr Arg Asn Thr Tyr Arg Cys Gly Asp
260 265 270
Val Gly Gly Thr Gly Leu Pro Glu Thr Trp Cys Arg Gly Lys Gly Gly
275 280 285
Ile Trp Val Asn Gln Ser Lys Glu Ile Asn Glu Thr Glu Pro Phe Ser
290 295 300
Phe Thr Ala Asn Cys Thr Gly Ser Asn Leu Gly Asn Val Ser Gly Cys
305 310 315 320
Cys Gly Glu Pro Ile Thr Ile Leu Pro Leu Gly Ala Trp Ile Asp Ser
325 330 335
Thr Gln Gly Ser Phe Thr Lys Pro Lys Ala Leu Pro Pro Ala Ile Phe
340 345 350
Leu Ile Cys Gly Asp Arg Ala Trp Gln Gly Ile Pro Ser Arg Pro Val
355 360 365
Gly Gly Pro Cys Tyr Leu Gly Lys Leu Thr Met Leu Ala Pro Asn His
370 375 380
Thr Asp Ile Leu Lys Ile Leu Ala Asn Ser Ser Arg Thr Gly Ile Arg
385 390 395 400
Arg Lys Arg Ser Val Ser His Leu Asp Asp Thr Cys Ser Asp Glu Val
405 410 415
Gln Leu Trp Gly Pro Thr Ala Arg Ile Phe Ala Ser Ile Leu Ala Pro
420 425 430
Gly Val Ala Ala Ala Gln Ala Leu Arg Glu Ile Glu Arg Leu Ala Cys
435 440 445
Trp Ser Val Lys Gln Ala Asn Leu Thr Thr Ser Leu Leu Gly Asp Leu
450 455 460
Leu Asp Asp Val Thr Ser Ile Arg His Ala Val Leu Gln Asn Arg Ala
465 470 475 480
Ala Ile Asp Phe Leu Leu Leu Ala His Gly His Gly Cys Glu Asp Val
485 490 495
Ala Gly Met Cys Cys Phe Asn Leu Ser Asp His Ser Glu Ser Ile Gln
500 505 510
Lys Lys Phe Gln Leu Met Lys Lys His Val Asn Lys Ile Gly Val Asp
515 520 525
Ser Asp Pro Ile Gly Ser Trp Leu Arg Gly Ile Phe Gly Gly Ile Gly
530 535 540
Glu Trp Ala Val His Leu Leu Lys Gly Leu Leu Leu Gly Leu Val Val
545 550 555 560
Ile Leu Leu Leu Leu Val Cys Leu Pro Cys Leu Leu Gln Phe Val Ser
565 570 575
Ser Ser Ile Arg Lys Met Ile Asn Ser Ser Ile Asn Tyr His Thr Glu
580 585 590
Tyr Arg Lys Met Gln Gly Gly Ala Val
595 600
<210> 445
<211> 1467
<212> DNA
<213> Betaretrovirus Mouse mammary tumor virus
<400> 445
atgggtaagt ttctcgccac tttgatttta ttcttccagt tctgccccct catcttcggt 60
gattacagcc ccagctgctg tactctcaca attggagtct cctcatacca ctctaaaccc 120
tgcaatcctg cccagccagt ttgttcgtgg accctcgacc tgctggccct ttcagcagat 180
caggccctac agcccccctg ccctaaccta gtaagttact ccagctacca tgccacctat 240
tccctatatc tattccctca ttggactaag aagccaaacc gaaatggcgg aggctattat 300
tcagcctctt attcagaccc ttgttcctta aagtgcccat acctggggtg ccaatcatgg 360
acctgcccct atacaggagc cgtctccagc ccctactgga agtttcaaca cgatgtcaat 420
tttactcaag aagtttcacg cctcaatatt aatctccatt tttcaaaatg cggttttccc 480
ttctcccttc tagtcgacgc tccaggatat gaccccatct ggttccttaa taccgaaccc 540
agccaactgc ctcccaccgc ccctcctcta ctcccccact ctaacctaga ccacatcctc 600
gagccctcta taccatggaa atcaaaactc ctgacccttg tccagttaac cctacaaagc 660
actaattata cttgcattgt ctgtatcgat cgtgccagcc tctccacttg gcacgtccta 720
tactctccca acgtctctgt tccatcctct tcttctaccc ccctccttta cccatcgtta 780
gcgcttccag ccccccacct gacgttacca tttaactgga cccactgctt tgacccccag 840
attcaagcta tagtctcctc cccctgtcat aactccctca tcctgccccc cttttccttg 900
tcacctgttc ccaccctagg atcccgctcc cgccgagcgg taccggtggc ggtctggctt 960
gtctccgccc tggccatggg agccggagtg gctggcggga ttaccggctc catgtccctc 1020
gcctcaggaa agagcctcct acatgaggtg gacaaagata tttcccagtt aactcaagca 1080
atagtcaaaa accacaaaaa tctactcaaa attgcgcagt atgctgccca gaacagacga 1140
ggccttgatc tcctgttctg ggagcaagga ggattatgca aagcattaca agaacagtgc 1200
cgttttccga atattaccaa ttcccatgtc ccaatactac aagaaagacc cccccttgag 1260
aatcgagtcc tgactggctg gggccttaac tgggaccttg gcctctcaca gtgggctcga 1320
gaggccttac aaactggaat cacccttgtt gcgctactcc ttcttgttat ccttgcagga 1380
ccatgcatcc tccgtcagct acgacacctc ccctcgcgcg tcagataccc ccattactct 1440
cttataaaac ctgagtcatc cctgtaa 1467
<210> 446
<211> 688
<212> PRT
<213> Betaretrovirus Mouse mammary tumor virus
<400> 446
Met Pro Lys His Gln Ser Gly Ser Pro Thr Asp Ser Ser Asp Leu Leu
1 5 10 15
Leu Ser Gly Lys Lys Gln Arg Pro His Leu Ala Leu Arg Arg Lys Arg
20 25 30
Arg Arg Glu Met Arg Lys Ile Asn Arg Lys Val Pro Arg Met Asn Leu
35 40 45
Val Pro Ile Lys Glu Lys Thr Ala Trp Gln His Leu Gln Ala Leu Ile
50 55 60
Ser Glu Ala Glu Glu Val Leu Lys Thr Ser Gln Thr Pro Gln Thr Ser
65 70 75 80
Leu Thr Leu Phe Leu Ala Leu Leu Ser Val Leu Gly Pro Pro Pro Val
85 90 95
Thr Gly Glu Ser Tyr Trp Ala Tyr Leu Pro Lys Pro Pro Ile Leu His
100 105 110
Pro Val Gly Trp Gly Ser Thr Asp Pro Ile Arg Val Leu Thr Asn Gln
115 120 125
Thr Met Tyr Leu Gly Gly Ser Pro Asp Phe His Gly Phe Arg Asn Met
130 135 140
Ser Gly Asn Val His Phe Glu Gly Lys Ser Asp Thr Leu Pro Ile Cys
145 150 155 160
Leu Ser Phe Ser Phe Ser Thr Pro Thr Gly Cys Phe Gln Val Asp Lys
165 170 175
Gln Val Phe Leu Ser Asp Thr Pro Thr Val Asp Asn Asn Lys Pro Gly
180 185 190
Gly Lys Gly Asp Lys Arg Arg Met Trp Glu Leu Trp Leu Thr Thr Leu
195 200 205
Gly Asn Ser Gly Ala Asn Thr Lys Leu Val Pro Ile Lys Lys Lys Leu
210 215 220
Pro Pro Lys Tyr Pro His Cys Gln Ile Ala Phe Lys Lys Asp Ala Phe
225 230 235 240
Trp Glu Gly Asp Glu Ser Ala Pro Pro Arg Trp Leu Pro Cys Ala Phe
245 250 255
Pro Asp Gln Gly Val Ser Phe Ser Pro Lys Gly Ala Leu Gly Leu Leu
260 265 270
Trp Asp Phe Ser Leu Pro Ser Pro Ser Val Asp Gln Ser Asp Gln Ile
275 280 285
Lys Ser Lys Lys Asn Leu Phe Gly Asn Tyr Thr Pro Pro Val Asn Lys
290 295 300
Glu Val His Arg Trp Tyr Glu Ala Gly Trp Val Glu Pro Thr Trp Phe
305 310 315 320
Trp Glu Asn Ser Pro Lys Asp Pro Asn Asp Arg Asp Phe Thr Ala Leu
325 330 335
Val Pro His Thr Glu Leu Phe Arg Leu Val Ala Ala Ser Arg His Leu
340 345 350
Ile Leu Lys Arg Pro Gly Phe Gln Glu His Glu Met Ile Pro Thr Ser
355 360 365
Ala Cys Val Thr Tyr Pro Tyr Ala Ile Leu Leu Gly Leu Pro Gln Leu
370 375 380
Ile Asp Ile Glu Lys Arg Gly Ser Thr Phe His Ile Ser Cys Ser Ser
385 390 395 400
Cys Arg Leu Thr Asn Cys Leu Asp Ser Ser Ala Tyr Asp Tyr Ala Ala
405 410 415
Ile Ile Val Lys Arg Pro Pro Tyr Val Leu Leu Pro Val Asp Ile Gly
420 425 430
Asp Glu Pro Trp Phe Asp Asp Ser Ala Ile Gln Thr Phe Arg Tyr Ala
435 440 445
Thr Asp Leu Ile Arg Ala Lys Arg Phe Val Ala Ala Ile Ile Leu Gly
450 455 460
Ile Ser Ala Leu Ile Ala Ile Ile Thr Ser Phe Ala Val Ala Thr Thr
465 470 475 480
Ala Leu Val Lys Glu Met Gln Thr Ala Thr Phe Val Asn Asn Leu His
485 490 495
Arg Asn Val Thr Leu Ala Leu Ser Glu Gln Arg Ile Ile Asp Leu Lys
500 505 510
Leu Glu Ala Arg Leu Asn Ala Leu Glu Glu Val Val Leu Glu Leu Gly
515 520 525
Gln Asp Val Ala Asn Leu Lys Thr Arg Met Ser Thr Arg Cys His Ala
530 535 540
Asn Tyr Asp Phe Ile Cys Val Thr Pro Leu Pro Tyr Asn Ala Thr Glu
545 550 555 560
Asn Trp Glu Arg Thr Arg Ala His Leu Leu Gly Ile Trp Asn Asp Asn
565 570 575
Glu Ile Ser Tyr Asn Ile Gln Glu Leu Thr Asn Leu Ile Ser Asp Met
580 585 590
Ser Lys Gln His Ile Asp Ala Val Asp Leu Ser Gly Leu Ala Gln Ser
595 600 605
Phe Ala Asn Gly Val Lys Ala Leu Asn Pro Leu Asp Trp Thr Gln Tyr
610 615 620
Phe Ile Phe Ile Gly Val Gly Ala Leu Leu Leu Val Ile Val Leu Met
625 630 635 640
Ile Phe Pro Ile Val Phe Gln Cys Leu Ala Lys Ser Leu Asp Gln Val
645 650 655
Gln Ser Asp Leu Asn Val Leu Leu Leu Lys Lys Lys Lys Gly Gly Asn
660 665 670
Ala Ala Pro Ala Ala Glu Met Val Glu Leu Pro Arg Val Ser Tyr Thr
675 680 685
<210> 447
<211> 1467
<212> DNA
<213> Deltaretrovirus Human T-lymphotropic virus 1
<400> 447
atgggtaagt ttctcgccac tttgatttta ttcttccagt tctgccccct catcttcggt 60
gattacagcc ccagctgctg tactctcaca attggagtct cctcatacca ctctaaaccc 120
tgcaatcctg cccagccagt ttgttcgtgg accctcgacc tgctggccct ttcagcagat 180
caggccctac agcccccctg ccctaaccta gtaagttact ccagctacca tgccacctat 240
tccctatatc tattccctca ttggactaag aagccaaacc gaaatggcgg aggctattat 300
tcagcctctt attcagaccc ttgttcctta aagtgcccat acctggggtg ccaatcatgg 360
acctgcccct atacaggagc cgtctccagc ccctactgga agtttcaaca cgatgtcaat 420
tttactcaag aagtttcacg cctcaatatt aatctccatt tttcaaaatg cggttttccc 480
ttctcccttc tagtcgacgc tccaggatat gaccccatct ggttccttaa taccgaaccc 540
agccaactgc ctcccaccgc ccctcctcta ctcccccact ctaacctaga ccacatcctc 600
gagccctcta taccatggaa atcaaaactc ctgacccttg tccagttaac cctacaaagc 660
actaattata cttgcattgt ctgtatcgat cgtgccagcc tctccacttg gcacgtccta 720
tactctccca acgtctctgt tccatcctct tcttctaccc ccctccttta cccatcgtta 780
gcgcttccag ccccccacct gacgttacca tttaactgga cccactgctt tgacccccag 840
attcaagcta tagtctcctc cccctgtcat aactccctca tcctgccccc cttttccttg 900
tcacctgttc ccaccctagg atcccgctcc cgccgagcgg taccggtggc ggtctggctt 960
gtctccgccc tggccatggg agccggagtg gctggcggga ttaccggctc catgtccctc 1020
gcctcaggaa agagcctcct acatgaggtg gacaaagata tttcccagtt aactcaagca 1080
atagtcaaaa accacaaaaa tctactcaaa attgcgcagt atgctgccca gaacagacga 1140
ggccttgatc tcctgttctg ggagcaagga ggattatgca aagcattaca agaacagtgc 1200
cgttttccga atattaccaa ttcccatgtc ccaatactac aagaaagacc cccccttgag 1260
aatcgagtcc tgactggctg gggccttaac tgggaccttg gcctctcaca gtgggctcga 1320
gaggccttac aaactggaat cacccttgtt gcgctactcc ttcttgttat ccttgcagga 1380
ccatgcatcc tccgtcagct acgacacctc ccctcgcgcg tcagataccc ccattactct 1440
cttataaaac ctgagtcatc cctgtaa 1467
<210> 448
<211> 488
<212> PRT
<213> Deltaretrovirus Human T-lymphotropic virus 1
<400> 448
Met Gly Lys Phe Leu Ala Thr Leu Ile Leu Phe Phe Gln Phe Cys Pro
1 5 10 15
Leu Ile Phe Gly Asp Tyr Ser Pro Ser Cys Cys Thr Leu Thr Ile Gly
20 25 30
Val Ser Ser Tyr His Ser Lys Pro Cys Asn Pro Ala Gln Pro Val Cys
35 40 45
Ser Trp Thr Leu Asp Leu Leu Ala Leu Ser Ala Asp Gln Ala Leu Gln
50 55 60
Pro Pro Cys Pro Asn Leu Val Ser Tyr Ser Ser Tyr His Ala Thr Tyr
65 70 75 80
Ser Leu Tyr Leu Phe Pro His Trp Thr Lys Lys Pro Asn Arg Asn Gly
85 90 95
Gly Gly Tyr Tyr Ser Ala Ser Tyr Ser Asp Pro Cys Ser Leu Lys Cys
100 105 110
Pro Tyr Leu Gly Cys Gln Ser Trp Thr Cys Pro Tyr Thr Gly Ala Val
115 120 125
Ser Ser Pro Tyr Trp Lys Phe Gln His Asp Val Asn Phe Thr Gln Glu
130 135 140
Val Ser Arg Leu Asn Ile Asn Leu His Phe Ser Lys Cys Gly Phe Pro
145 150 155 160
Phe Ser Leu Leu Val Asp Ala Pro Gly Tyr Asp Pro Ile Trp Phe Leu
165 170 175
Asn Thr Glu Pro Ser Gln Leu Pro Pro Thr Ala Pro Pro Leu Leu Pro
180 185 190
His Ser Asn Leu Asp His Ile Leu Glu Pro Ser Ile Pro Trp Lys Ser
195 200 205
Lys Leu Leu Thr Leu Val Gln Leu Thr Leu Gln Ser Thr Asn Tyr Thr
210 215 220
Cys Ile Val Cys Ile Asp Arg Ala Ser Leu Ser Thr Trp His Val Leu
225 230 235 240
Tyr Ser Pro Asn Val Ser Val Pro Ser Ser Ser Ser Thr Pro Leu Leu
245 250 255
Tyr Pro Ser Leu Ala Leu Pro Ala Pro His Leu Thr Leu Pro Phe Asn
260 265 270
Trp Thr His Cys Phe Asp Pro Gln Ile Gln Ala Ile Val Ser Ser Pro
275 280 285
Cys His Asn Ser Leu Ile Leu Pro Pro Phe Ser Leu Ser Pro Val Pro
290 295 300
Thr Leu Gly Ser Arg Ser Arg Arg Ala Val Pro Val Ala Val Trp Leu
305 310 315 320
Val Ser Ala Leu Ala Met Gly Ala Gly Val Ala Gly Gly Ile Thr Gly
325 330 335
Ser Met Ser Leu Ala Ser Gly Lys Ser Leu Leu His Glu Val Asp Lys
340 345 350
Asp Ile Ser Gln Leu Thr Gln Ala Ile Val Lys Asn His Lys Asn Leu
355 360 365
Leu Lys Ile Ala Gln Tyr Ala Ala Gln Asn Arg Arg Gly Leu Asp Leu
370 375 380
Leu Phe Trp Glu Gln Gly Gly Leu Cys Lys Ala Leu Gln Glu Gln Cys
385 390 395 400
Arg Phe Pro Asn Ile Thr Asn Ser His Val Pro Ile Leu Gln Glu Arg
405 410 415
Pro Pro Leu Glu Asn Arg Val Leu Thr Gly Trp Gly Leu Asn Trp Asp
420 425 430
Leu Gly Leu Ser Gln Trp Ala Arg Glu Ala Leu Gln Thr Gly Ile Thr
435 440 445
Leu Val Ala Leu Leu Leu Leu Val Ile Leu Ala Gly Pro Cys Ile Leu
450 455 460
Arg Gln Leu Arg His Leu Pro Ser Arg Val Arg Tyr Pro His Tyr Ser
465 470 475 480
Leu Ile Lys Pro Glu Ser Ser Leu
485
<210> 449
<211> 1698
<212> DNA
<213> Unknown
<220>
<223> RD114 Endogenous Feline Retrovirus
<400> 449
atgaaactcc caacaggaat ggtcatttta tgtagcctaa taatagttcg ggcagggttt 60
gacgaccccc gcaaggctat cgcattagta caaaaacaac atggtaaacc atgcgaatgc 120
agcggagggc aggtatccga ggccccaccg aactccatcc aacaggtaac ttgcccaggc 180
aagacggcct acttaatgac caaccaaaaa tggaaatgca gagtcactcc aaaaaatctc 240
acccctagcg ggggagaact ccagaactgc ccctgtaaca ctttccagga ctcgatgcac 300
agttcttgtt atactgaata ccggcaatgc agggcgaata ataagacata ctacacggcc 360
accttgctta aaatacggtc tgggagcctc aacgaggtac agatattaca aaaccccaat 420
cagctcctac agtccccttg taggggctct ataaatcagc ccgtttgctg gagtgccaca 480
gcccccatcc atatctccga tggtggagga cccctcgata ctaagagagt gtggacagtc 540
caaaaaaggc tagaacaaat tcataaggct atgcatcctg aacttcaata ccacccctta 600
gccctgccca aagtcagaga tgaccttagc cttgatgcac ggacttttga tatcctgaat 660
accactttta ggttactcca gatgtccaat tttagccttg cccaagattg ttggctctgt 720
ttaaaactag gtacccctac ccctcttgcg atacccactc cctctttaac ctactcccta 780
gcagactccc tagcgaatgc ctcctgtcag attatacctc ccctcttggt tcaaccgatg 840
cagttctcca actcgtcctg tttatcttcc cctttcatta acgatacgga acaaatagac 900
ttaggtgcag tcacctttac taactgcacc tctgtagcca atgtcagtag tcctttatgt 960
gccctaaacg ggtcagtctt cctctgtgga aataacatgg catacaccta tttaccccaa 1020
aactggacag gactttgcgt ccaagcctcc ctcctccccg acattgacat catcccgggg 1080
gatgagccag tccccattcc tgccattgat cattatatac atagacctaa acgagctgta 1140
cagttcatcc ctttactagc tggactggga atcaccgcag cattcaccac cggagctaca 1200
ggcctaggtg tctccgtcac ccagtataca aaattatccc atcagttaat atctgatgtc 1260
caagtcttat ccggtaccat acaagattta caagaccagg tagactcgtt agctgaagta 1320
gttctccaaa ataggagggg actggaccta ctaacggcag aacaaggagg aatttgttta 1380
gccttacaag aaaaatgctg tttttatgct aacaagtcag gaattgtgag aaacaaaata 1440
agaaccctac aagaagaatt acaaaaacgc agggaaagcc tggcatccaa ccctctctgg 1500
accgggctgc agggctttct tccgtacctc ctacctctcc tgggacccct actcaccctc 1560
ctactcatac taaccattgg gccatgcgtt ttcagtcgcc tcatggcctt cattaatgat 1620
agacttaatg ttgtacatgc catggtgctg gcccagcaat accaagcact caaagctgag 1680
gaagaagctc aggattga 1698
<210> 450
<211> 565
<212> PRT
<213> Unknown
<220>
<223> RD114 Endogenous Feline Retrovirus
<400> 450
Met Lys Leu Pro Thr Gly Met Val Ile Leu Cys Ser Leu Ile Ile Val
1 5 10 15
Arg Ala Gly Phe Asp Asp Pro Arg Lys Ala Ile Ala Leu Val Gln Lys
20 25 30
Gln His Gly Lys Pro Cys Glu Cys Ser Gly Gly Gln Val Ser Glu Ala
35 40 45
Pro Pro Asn Ser Ile Gln Gln Val Thr Cys Pro Gly Lys Thr Ala Tyr
50 55 60
Leu Met Thr Asn Gln Lys Trp Lys Cys Arg Val Thr Pro Lys Asn Leu
65 70 75 80
Thr Pro Ser Gly Gly Glu Leu Gln Asn Cys Pro Cys Asn Thr Phe Gln
85 90 95
Asp Ser Met His Ser Ser Cys Tyr Thr Glu Tyr Arg Gln Cys Arg Ala
100 105 110
Asn Asn Lys Thr Tyr Tyr Thr Ala Thr Leu Leu Lys Ile Arg Ser Gly
115 120 125
Ser Leu Asn Glu Val Gln Ile Leu Gln Asn Pro Asn Gln Leu Leu Gln
130 135 140
Ser Pro Cys Arg Gly Ser Ile Asn Gln Pro Val Cys Trp Ser Ala Thr
145 150 155 160
Ala Pro Ile His Ile Ser Asp Gly Gly Gly Pro Leu Asp Thr Lys Arg
165 170 175
Val Trp Thr Val Gln Lys Arg Leu Glu Gln Ile His Lys Ala Met His
180 185 190
Pro Glu Leu Gln Tyr His Pro Leu Ala Leu Pro Lys Val Arg Asp Asp
195 200 205
Leu Ser Leu Asp Ala Arg Thr Phe Asp Ile Leu Asn Thr Thr Phe Arg
210 215 220
Leu Leu Gln Met Ser Asn Phe Ser Leu Ala Gln Asp Cys Trp Leu Cys
225 230 235 240
Leu Lys Leu Gly Thr Pro Thr Pro Leu Ala Ile Pro Thr Pro Ser Leu
245 250 255
Thr Tyr Ser Leu Ala Asp Ser Leu Ala Asn Ala Ser Cys Gln Ile Ile
260 265 270
Pro Pro Leu Leu Val Gln Pro Met Gln Phe Ser Asn Ser Ser Cys Leu
275 280 285
Ser Ser Pro Phe Ile Asn Asp Thr Glu Gln Ile Asp Leu Gly Ala Val
290 295 300
Thr Phe Thr Asn Cys Thr Ser Val Ala Asn Val Ser Ser Pro Leu Cys
305 310 315 320
Ala Leu Asn Gly Ser Val Phe Leu Cys Gly Asn Asn Met Ala Tyr Thr
325 330 335
Tyr Leu Pro Gln Asn Trp Thr Gly Leu Cys Val Gln Ala Ser Leu Leu
340 345 350
Pro Asp Ile Asp Ile Ile Pro Gly Asp Glu Pro Val Pro Ile Pro Ala
355 360 365
Ile Asp His Tyr Ile His Arg Pro Lys Arg Ala Val Gln Phe Ile Pro
370 375 380
Leu Leu Ala Gly Leu Gly Ile Thr Ala Ala Phe Thr Thr Gly Ala Thr
385 390 395 400
Gly Leu Gly Val Ser Val Thr Gln Tyr Thr Lys Leu Ser His Gln Leu
405 410 415
Ile Ser Asp Val Gln Val Leu Ser Gly Thr Ile Gln Asp Leu Gln Asp
420 425 430
Gln Val Asp Ser Leu Ala Glu Val Val Leu Gln Asn Arg Arg Gly Leu
435 440 445
Asp Leu Leu Thr Ala Glu Gln Gly Gly Ile Cys Leu Ala Leu Gln Glu
450 455 460
Lys Cys Cys Phe Tyr Ala Asn Lys Ser Gly Ile Val Arg Asn Lys Ile
465 470 475 480
Arg Thr Leu Gln Glu Glu Leu Gln Lys Arg Arg Glu Ser Leu Ala Ser
485 490 495
Asn Pro Leu Trp Thr Gly Leu Gln Gly Phe Leu Pro Tyr Leu Leu Pro
500 505 510
Leu Leu Gly Pro Leu Leu Thr Leu Leu Leu Ile Leu Thr Ile Gly Pro
515 520 525
Cys Val Phe Ser Arg Leu Met Ala Phe Ile Asn Asp Arg Leu Asn Val
530 535 540
Val His Ala Met Val Leu Ala Gln Gln Tyr Gln Ala Leu Lys Ala Glu
545 550 555 560
Glu Glu Ala Gln Asp
565
<210> 451
<211> 2058
<212> DNA
<213> Gammaretrovirus Gibbon ape leukemia virus
<400> 451
atggtattgc tgcctgggtc catgcttctc acctcaagcc tgcaccacct tcggcaccag 60
atgagtcctg ggagttggaa aagactgatc atcctcttaa gctgcgtatt cggcggcggc 120
ggaacgagtc tgcaaaataa gaacccccac cagcctatga ccctcacctg gcaggtactg 180
tcccaaactg gagacgttgt ctgggataca aaggcagtcc agcccccttg gacttggtgg 240
cccacactta aacctgatat atgtgccttg gcggctggtc ttgagtcctg ggatatcccg 300
ggaaccgatg tctcgtcctc taaacgagtc agacctccgg actcagacta tactgccgct 360
tataaacaaa tcacctgggg agccataggg tgcagctacc ctcgggctag gaccagaatg 420
gcaagctcca ccttctacgt atgtccccgg gatggccgga ccccttcaga agctagaagg 480
tgcggggggc tagaatccct atactgtaaa gaatggaatt gtgaaaccac agggaccggt 540
tattggctac ccaagtcctc aaaagacctc ataacgggta gatgggatca aaatagcaaa 600
tgggatcaaa aatttcaaaa gtgtcaccag accggctggt gtaaccccct taaaatagat 660
ttcacagaca caggaaaatc ctccagggat tggatagtag gaaaaacctg gggattaaga 720
ttctatgtgc atggacatcc aggcgtccag ttcaccattc gcttaaaaat caccagcatg 780
acagctgtgg cagtcggccc cgatcccgtc cttgtggaac aaggacctcc cagaagggcc 840
ctcgctctcc cacctcctct ccccccaagg gaagcgccac cgccacctct ccccgactcc 900
aactccacaa ccctggcgac tagtgcacaa actcccacgg tgggaaaaac aattgttacc 960
ctaaacactc cgcctcccac cacaggcgac agactcttta acctcgtgca gggggccttc 1020
ctaaccctga atgctaccaa cccaggggcc actaagtcat gctggctttg tttggccatg 1080
ggtcccccct attatgaagc aataacctca ttgggggagg tcgcttattc caccagccag 1140
gaccggtgcc actggggaac ccaaggaaag cttaccctca ctgaggtctc aggacacggg 1200
ttatgcatag gaaaggtgcc cttcacccat cagcatctct gcaatcagac cctatccatc 1260
aattcctccg agggccatca gtatctgctc ccctccaatc atagctggtg ggcttgcagc 1320
actggcctca ccccttgcct ctctacctca gtttttaatc agagtcgaga tttctgtatc 1380
caggtccagc tgatccctcg catctattac tatcctgaag aagttttgtt acaggcctat 1440
gacgattctc accccaggcc taaaagagaa gctgtctcac ttaccctagc tgttttactg 1500
gggttgggga tcacggcggg tataggtact ggttcaaccg ccttaattaa aggacccata 1560
gacctccaac aaggcctgac cagcctccag atcgccatag atgctgacct ccgggccctc 1620
caggactcag tcagcaagct ggaggactca ctgacctccc tgtccgaggt agtactccaa 1680
aataggagag gccttgactt gctgtttcta aaggaaggag gcctctgtgc ggccctaaaa 1740
gaagagtgct gtttttatat agaccactca ggtgcagtac gagactccat gaaaaaactc 1800
aaagaaaaac tagataaaag acagttagag cgccagaaaa accaaaactg gtatgaaggg 1860
tggttcaata actccccttg gttcactacc ctactatcaa ccattgccgg gcccctgtta 1920
ctcctccttc tattgctcat cctcgggccc tgcatcatca ataagttagt tcaattcatc 1980
aatgatagag taagtgcagt taaaattttg gtccttagga caaaatatca ggccctagat 2040
aacgaagata acctttaa 2058
<210> 452
<211> 685
<212> PRT
<213> Gammaretrovirus Gibbon ape leukemia virus
<400> 452
Met Val Leu Leu Pro Gly Ser Met Leu Leu Thr Ser Ser Leu His His
1 5 10 15
Leu Arg His Gln Met Ser Pro Gly Ser Trp Lys Arg Leu Ile Ile Leu
20 25 30
Leu Ser Cys Val Phe Gly Gly Gly Gly Thr Ser Leu Gln Asn Lys Asn
35 40 45
Pro His Gln Pro Met Thr Leu Thr Trp Gln Val Leu Ser Gln Thr Gly
50 55 60
Asp Val Val Trp Asp Thr Lys Ala Val Gln Pro Pro Trp Thr Trp Trp
65 70 75 80
Pro Thr Leu Lys Pro Asp Ile Cys Ala Leu Ala Ala Gly Leu Glu Ser
85 90 95
Trp Asp Ile Pro Gly Thr Asp Val Ser Ser Ser Lys Arg Val Arg Pro
100 105 110
Pro Asp Ser Asp Tyr Thr Ala Ala Tyr Lys Gln Ile Thr Trp Gly Ala
115 120 125
Ile Gly Cys Ser Tyr Pro Arg Ala Arg Thr Arg Met Ala Ser Ser Thr
130 135 140
Phe Tyr Val Cys Pro Arg Asp Gly Arg Thr Pro Ser Glu Ala Arg Arg
145 150 155 160
Cys Gly Gly Leu Glu Ser Leu Tyr Cys Lys Glu Trp Asn Cys Glu Thr
165 170 175
Thr Gly Thr Gly Tyr Trp Leu Pro Lys Ser Ser Lys Asp Leu Ile Thr
180 185 190
Gly Arg Trp Asp Gln Asn Ser Lys Trp Asp Gln Lys Phe Gln Lys Cys
195 200 205
His Gln Thr Gly Trp Cys Asn Pro Leu Lys Ile Asp Phe Thr Asp Thr
210 215 220
Gly Lys Ser Ser Arg Asp Trp Ile Val Gly Lys Thr Trp Gly Leu Arg
225 230 235 240
Phe Tyr Val His Gly His Pro Gly Val Gln Phe Thr Ile Arg Leu Lys
245 250 255
Ile Thr Ser Met Thr Ala Val Ala Val Gly Pro Asp Pro Val Leu Val
260 265 270
Glu Gln Gly Pro Pro Arg Arg Ala Leu Ala Leu Pro Pro Pro Leu Pro
275 280 285
Pro Arg Glu Ala Pro Pro Pro Pro Leu Pro Asp Ser Asn Ser Thr Thr
290 295 300
Leu Ala Thr Ser Ala Gln Thr Pro Thr Val Gly Lys Thr Ile Val Thr
305 310 315 320
Leu Asn Thr Pro Pro Pro Thr Thr Gly Asp Arg Leu Phe Asn Leu Val
325 330 335
Gln Gly Ala Phe Leu Thr Leu Asn Ala Thr Asn Pro Gly Ala Thr Lys
340 345 350
Ser Cys Trp Leu Cys Leu Ala Met Gly Pro Pro Tyr Tyr Glu Ala Ile
355 360 365
Thr Ser Leu Gly Glu Val Ala Tyr Ser Thr Ser Gln Asp Arg Cys His
370 375 380
Trp Gly Thr Gln Gly Lys Leu Thr Leu Thr Glu Val Ser Gly His Gly
385 390 395 400
Leu Cys Ile Gly Lys Val Pro Phe Thr His Gln His Leu Cys Asn Gln
405 410 415
Thr Leu Ser Ile Asn Ser Ser Glu Gly His Gln Tyr Leu Leu Pro Ser
420 425 430
Asn His Ser Trp Trp Ala Cys Ser Thr Gly Leu Thr Pro Cys Leu Ser
435 440 445
Thr Ser Val Phe Asn Gln Ser Arg Asp Phe Cys Ile Gln Val Gln Leu
450 455 460
Ile Pro Arg Ile Tyr Tyr Tyr Pro Glu Glu Val Leu Leu Gln Ala Tyr
465 470 475 480
Asp Asp Ser His Pro Arg Pro Lys Arg Glu Ala Val Ser Leu Thr Leu
485 490 495
Ala Val Leu Leu Gly Leu Gly Ile Thr Ala Gly Ile Gly Thr Gly Ser
500 505 510
Thr Ala Leu Ile Lys Gly Pro Ile Asp Leu Gln Gln Gly Leu Thr Ser
515 520 525
Leu Gln Ile Ala Ile Asp Ala Asp Leu Arg Ala Leu Gln Asp Ser Val
530 535 540
Ser Lys Leu Glu Asp Ser Leu Thr Ser Leu Ser Glu Val Val Leu Gln
545 550 555 560
Asn Arg Arg Gly Leu Asp Leu Leu Phe Leu Lys Glu Gly Gly Leu Cys
565 570 575
Ala Ala Leu Lys Glu Glu Cys Cys Phe Tyr Ile Asp His Ser Gly Ala
580 585 590
Val Arg Asp Ser Met Lys Lys Leu Lys Glu Lys Leu Asp Lys Arg Gln
595 600 605
Leu Glu Arg Gln Lys Asn Gln Asn Trp Tyr Glu Gly Trp Phe Asn Asn
610 615 620
Ser Pro Trp Phe Thr Thr Leu Leu Ser Thr Ile Ala Gly Pro Leu Leu
625 630 635 640
Leu Leu Leu Leu Leu Leu Ile Leu Gly Pro Cys Ile Ile Asn Lys Leu
645 650 655
Val Gln Phe Ile Asn Asp Arg Val Ser Ala Val Lys Ile Leu Val Leu
660 665 670
Arg Thr Lys Tyr Gln Ala Leu Asp Asn Glu Asp Asn Leu
675 680 685
<210> 453
<211> 1998
<212> DNA
<213> Gammaretrovirus Moloney Murine leukemia virus
<400> 453
atggcgcgtt caacgctctc aaaacccctt aaaaataagg ttaacccgcg aggcccccta 60
atccccttaa ttcttctgat gctcagaggg gtcagtactg cttcgcccgg ctccagtcct 120
catcaagtct ataatatcac ctgggaggta accaatggag atcgggagac ggtatgggca 180
acttctggca accaccctct gtggacctgg tggcctgacc ttaccccaga tttatgtatg 240
ttagcccacc atggaccatc ttattggggg ctagaatatc aatccccttt ttcttctccc 300
ccggggcccc cttgttgctc agggggcagc agcccaggct gttccagaga ctgcgaagaa 360
cctttaacct ccctcacccc tcggtgcaac actgcctgga acagactcaa gctagaccag 420
acaactcata aatcaaatga gggattttat gtttgccccg ggccccaccg cccccgagaa 480
tccaagtcat gtgggggtcc agactccttc tactgtgcct attggggctg tgagacaacc 540
ggtagagctt actggaagcc ctcctcatca tgggatttca tcacagtaaa caacaatctc 600
acctctgacc aggctgtcca ggtatgcaaa gataataagt ggtgcaaccc cttagttatt 660
cggtttacag acgccgggag acgggttact tcctggacca caggacatta ctggggctta 720
cgtttgtatg tctccggaca agatccaggg cttacatttg ggatccgact cagataccaa 780
aatctaggac cccgcgtccc aatagggcca aaccccgttc tggcagacca acagccactc 840
tccaagccca aacctgttaa gtcgccttca gtcaccaaac cacccagtgg gactcctctc 900
tcccctaccc aacttccacc ggcgggaacg gaaaataggc tgctaaactt agtagacgga 960
gcctaccaag ccctcaacct caccagtcct gacaaaaccc aagagtgctg gttgtgtcta 1020
gtagcgggac ccccctacta cgaaggggtt gccgtcctgg gtacctactc caaccatacc 1080
tctgctccag ccaactgctc cgtggcctcc caacacaagt tgaccctgtc cgaagtgacc 1140
ggacagggac tctgcatagg agcagttccc aaaacacatc aggccctatg taataccacc 1200
cagacaagca gtcgagggtc ctattatcta gttgccccta caggtaccat gtgggcttgt 1260
agtaccgggc ttactccatg catctccacc accatactga accttaccac tgattattgt 1320
gttcttgtcg aactctggcc aagagtcacc tatcattccc ccagctatgt ttacggcctg 1380
tttgagagat ccaaccgaca caaaagagaa ccggtgtcgt taaccctggc cctattattg 1440
ggtggactaa ccatgggggg aattgccgct ggaataggaa cagggactac tgctctaatg 1500
gccactcagc aattccagca gctccaagcc gcagtacagg atgatctcag ggaggttgaa 1560
aaatcaatct ctaacctaga aaagtctctc acttccctgt ctgaagttgt cctacagaat 1620
cgaaggggcc tagacttgtt atttctaaaa gaaggagggc tgtgtgctgc tctaaaagaa 1680
gaatgttgct tctatgcgga ccacacagga ctagtgagag acagcatggc caaattgaga 1740
gagaggctta atcagagaca gaaactgttt gagtcaactc aaggatggtt tgagggactg 1800
tttaacagat ccccttggtt taccaccttg atatctacca ttatgggacc cctcattgta 1860
ctcctaatga ttttgctctt cggaccctgc attcttaatc gattagtcca atttgttaaa 1920
gacaggatat cagtggtcca ggctctagtt ttgactcaac aatatcacca gctgaagcct 1980
atagagtacg agccatag 1998
<210> 454
<211> 665
<212> PRT
<213> Gammaretrovirus Moloney Murine leukemia virus
<400> 454
Met Ala Arg Ser Thr Leu Ser Lys Pro Leu Lys Asn Lys Val Asn Pro
1 5 10 15
Arg Gly Pro Leu Ile Pro Leu Ile Leu Leu Met Leu Arg Gly Val Ser
20 25 30
Thr Ala Ser Pro Gly Ser Ser Pro His Gln Val Tyr Asn Ile Thr Trp
35 40 45
Glu Val Thr Asn Gly Asp Arg Glu Thr Val Trp Ala Thr Ser Gly Asn
50 55 60
His Pro Leu Trp Thr Trp Trp Pro Asp Leu Thr Pro Asp Leu Cys Met
65 70 75 80
Leu Ala His His Gly Pro Ser Tyr Trp Gly Leu Glu Tyr Gln Ser Pro
85 90 95
Phe Ser Ser Pro Pro Gly Pro Pro Cys Cys Ser Gly Gly Ser Ser Pro
100 105 110
Gly Cys Ser Arg Asp Cys Glu Glu Pro Leu Thr Ser Leu Thr Pro Arg
115 120 125
Cys Asn Thr Ala Trp Asn Arg Leu Lys Leu Asp Gln Thr Thr His Lys
130 135 140
Ser Asn Glu Gly Phe Tyr Val Cys Pro Gly Pro His Arg Pro Arg Glu
145 150 155 160
Ser Lys Ser Cys Gly Gly Pro Asp Ser Phe Tyr Cys Ala Tyr Trp Gly
165 170 175
Cys Glu Thr Thr Gly Arg Ala Tyr Trp Lys Pro Ser Ser Ser Trp Asp
180 185 190
Phe Ile Thr Val Asn Asn Asn Leu Thr Ser Asp Gln Ala Val Gln Val
195 200 205
Cys Lys Asp Asn Lys Trp Cys Asn Pro Leu Val Ile Arg Phe Thr Asp
210 215 220
Ala Gly Arg Arg Val Thr Ser Trp Thr Thr Gly His Tyr Trp Gly Leu
225 230 235 240
Arg Leu Tyr Val Ser Gly Gln Asp Pro Gly Leu Thr Phe Gly Ile Arg
245 250 255
Leu Arg Tyr Gln Asn Leu Gly Pro Arg Val Pro Ile Gly Pro Asn Pro
260 265 270
Val Leu Ala Asp Gln Gln Pro Leu Ser Lys Pro Lys Pro Val Lys Ser
275 280 285
Pro Ser Val Thr Lys Pro Pro Ser Gly Thr Pro Leu Ser Pro Thr Gln
290 295 300
Leu Pro Pro Ala Gly Thr Glu Asn Arg Leu Leu Asn Leu Val Asp Gly
305 310 315 320
Ala Tyr Gln Ala Leu Asn Leu Thr Ser Pro Asp Lys Thr Gln Glu Cys
325 330 335
Trp Leu Cys Leu Val Ala Gly Pro Pro Tyr Tyr Glu Gly Val Ala Val
340 345 350
Leu Gly Thr Tyr Ser Asn His Thr Ser Ala Pro Ala Asn Cys Ser Val
355 360 365
Ala Ser Gln His Lys Leu Thr Leu Ser Glu Val Thr Gly Gln Gly Leu
370 375 380
Cys Ile Gly Ala Val Pro Lys Thr His Gln Ala Leu Cys Asn Thr Thr
385 390 395 400
Gln Thr Ser Ser Arg Gly Ser Tyr Tyr Leu Val Ala Pro Thr Gly Thr
405 410 415
Met Trp Ala Cys Ser Thr Gly Leu Thr Pro Cys Ile Ser Thr Thr Ile
420 425 430
Leu Asn Leu Thr Thr Asp Tyr Cys Val Leu Val Glu Leu Trp Pro Arg
435 440 445
Val Thr Tyr His Ser Pro Ser Tyr Val Tyr Gly Leu Phe Glu Arg Ser
450 455 460
Asn Arg His Lys Arg Glu Pro Val Ser Leu Thr Leu Ala Leu Leu Leu
465 470 475 480
Gly Gly Leu Thr Met Gly Gly Ile Ala Ala Gly Ile Gly Thr Gly Thr
485 490 495
Thr Ala Leu Met Ala Thr Gln Gln Phe Gln Gln Leu Gln Ala Ala Val
500 505 510
Gln Asp Asp Leu Arg Glu Val Glu Lys Ser Ile Ser Asn Leu Glu Lys
515 520 525
Ser Leu Thr Ser Leu Ser Glu Val Val Leu Gln Asn Arg Arg Gly Leu
530 535 540
Asp Leu Leu Phe Leu Lys Glu Gly Gly Leu Cys Ala Ala Leu Lys Glu
545 550 555 560
Glu Cys Cys Phe Tyr Ala Asp His Thr Gly Leu Val Arg Asp Ser Met
565 570 575
Ala Lys Leu Arg Glu Arg Leu Asn Gln Arg Gln Lys Leu Phe Glu Ser
580 585 590
Thr Gln Gly Trp Phe Glu Gly Leu Phe Asn Arg Ser Pro Trp Phe Thr
595 600 605
Thr Leu Ile Ser Thr Ile Met Gly Pro Leu Ile Val Leu Leu Met Ile
610 615 620
Leu Leu Phe Gly Pro Cys Ile Leu Asn Arg Leu Val Gln Phe Val Lys
625 630 635 640
Asp Arg Ile Ser Val Val Gln Ala Leu Val Leu Thr Gln Gln Tyr His
645 650 655
Gln Leu Lys Pro Ile Glu Tyr Glu Pro
660 665
<210> 455
<211> 1692
<212> DNA
<213> Gammaretrovirus Baboon Endogenous Virus
<400> 455
atgggattca caacaaagat aatcttctta tacaacctag tactggtcta cgcggggttt 60
gacgaccctc gcaaagccat agaactagta caaaagcgat atggccgacc atgcgattgc 120
agcggaggac aagtgtccga gcccccgtca gacagggtca gtcaagtgac ttgctcaggc 180
aagacagctt acttaatgcc cgaccaaaga tggaaatgta agtcaattcc aaaagacacc 240
tccccaagcg ggccactcca agagtgcccc tgtaattctt accagtcctc agtacacagt 300
tcttgttata cctcatacca acaatgcaga tcaggcaata agacatatta tacggctact 360
ctgctaaaaa cacaaactgg gggcaccagt gatgtacaag tattaggatc caccaacaaa 420
cttatacaat ctccctgtaa tggcataaaa gggcagtcta tttgctggag cactacagct 480
cctatccacg tctctgatgg aggaggtcca ttagacacca caagaattaa aagtgttcag 540
agaaaactgg aagaaattca taaagcccta tatcctgaac ttcagtatca ccctttggcc 600
atacctaagg ttagagataa cctcatggtc gatgcccaga ctttaaacat tctcaatgcc 660
acttacaact tactcctaat gtccaacacg agcctagtgg acgactgttg gctttgttta 720
aaattaggtc cccctactcc cctcgcaata cctaacttcc tattatccta cgtgactcgc 780
tcctcggata atatctcttg tttaataatt cccccccttc tagttcaacc gatgcagttt 840
tccaattcat cttgcctctt ttccccctcc tacaacagta cagaagaaat agatctaggc 900
catgttgcct tcagcaactg tacctccata accaatgtca ccggtcccat atgcgctgta 960
aatggttcgg tctttctctg tggcaataac atggcataca cttatctacc cacgaactgg 1020
acggggcttt gcgtcctagc aactctcctc cccgacattg acatcattcc cggagatgaa 1080
ccggtcccca tccctgctat tgatcatttt atatatagac ctaaacgggc catacagttt 1140
attcctttac tagcagggct agggatcacc gcagccttca caacaggagc tacaggccta 1200
ggtgtctctg tgacccaata tacaaaatta tctaatcagc taatttctga tgtacaaatc 1260
ttatctagca ccatacaaga tctgcaagat caagtagact cattagccga agtggttctc 1320
cagaacagaa gggggctaga tctacttaca gcagaacaag gaggaatctg tttagccctg 1380
caagaaaaat gctgctttta tgttaacaag tcagggattg tgagagacaa aataaaaacc 1440
ttacaagaag aactagaaag acgtagaaaa gatctagctt ccaacccact ttggactggg 1500
cttcaagggc tcctccctta cctcctgccc tttcttggcc ctctacttac cctcctgctc 1560
ttactcacca ttgggccgtg catttttaac cgtctaaccg cttttattaa tgataagtta 1620
aacataatac acgctatggt gctaacccaa cagtatcagg tgctcagaac cgatgaagaa 1680
gctcaagatt ga 1692
<210> 456
<211> 563
<212> PRT
<213> Gammaretrovirus Baboon Endogenous Virus
<400> 456
Met Gly Phe Thr Thr Lys Ile Ile Phe Leu Tyr Asn Leu Val Leu Val
1 5 10 15
Tyr Ala Gly Phe Asp Asp Pro Arg Lys Ala Ile Glu Leu Val Gln Lys
20 25 30
Arg Tyr Gly Arg Pro Cys Asp Cys Ser Gly Gly Gln Val Ser Glu Pro
35 40 45
Pro Ser Asp Arg Val Ser Gln Val Thr Cys Ser Gly Lys Thr Ala Tyr
50 55 60
Leu Met Pro Asp Gln Arg Trp Lys Cys Lys Ser Ile Pro Lys Asp Thr
65 70 75 80
Ser Pro Ser Gly Pro Leu Gln Glu Cys Pro Cys Asn Ser Tyr Gln Ser
85 90 95
Ser Val His Ser Ser Cys Tyr Thr Ser Tyr Gln Gln Cys Arg Ser Gly
100 105 110
Asn Lys Thr Tyr Tyr Thr Ala Thr Leu Leu Lys Thr Gln Thr Gly Gly
115 120 125
Thr Ser Asp Val Gln Val Leu Gly Ser Thr Asn Lys Leu Ile Gln Ser
130 135 140
Pro Cys Asn Gly Ile Lys Gly Gln Ser Ile Cys Trp Ser Thr Thr Ala
145 150 155 160
Pro Ile His Val Ser Asp Gly Gly Gly Pro Leu Asp Thr Thr Arg Ile
165 170 175
Lys Ser Val Gln Arg Lys Leu Glu Glu Ile His Lys Ala Leu Tyr Pro
180 185 190
Glu Leu Gln Tyr His Pro Leu Ala Ile Pro Lys Val Arg Asp Asn Leu
195 200 205
Met Val Asp Ala Gln Thr Leu Asn Ile Leu Asn Ala Thr Tyr Asn Leu
210 215 220
Leu Leu Met Ser Asn Thr Ser Leu Val Asp Asp Cys Trp Leu Cys Leu
225 230 235 240
Lys Leu Gly Pro Pro Thr Pro Leu Ala Ile Pro Asn Phe Leu Leu Ser
245 250 255
Tyr Val Thr Arg Ser Ser Asp Asn Ile Ser Cys Leu Ile Ile Pro Pro
260 265 270
Leu Leu Val Gln Pro Met Gln Phe Ser Asn Ser Ser Cys Leu Phe Ser
275 280 285
Pro Ser Tyr Asn Ser Thr Glu Glu Ile Asp Leu Gly His Val Ala Phe
290 295 300
Ser Asn Cys Thr Ser Ile Thr Asn Val Thr Gly Pro Ile Cys Ala Val
305 310 315 320
Asn Gly Ser Val Phe Leu Cys Gly Asn Asn Met Ala Tyr Thr Tyr Leu
325 330 335
Pro Thr Asn Trp Thr Gly Leu Cys Val Leu Ala Thr Leu Leu Pro Asp
340 345 350
Ile Asp Ile Ile Pro Gly Asp Glu Pro Val Pro Ile Pro Ala Ile Asp
355 360 365
His Phe Ile Tyr Arg Pro Lys Arg Ala Ile Gln Phe Ile Pro Leu Leu
370 375 380
Ala Gly Leu Gly Ile Thr Ala Ala Phe Thr Thr Gly Ala Thr Gly Leu
385 390 395 400
Gly Val Ser Val Thr Gln Tyr Thr Lys Leu Ser Asn Gln Leu Ile Ser
405 410 415
Asp Val Gln Ile Leu Ser Ser Thr Ile Gln Asp Leu Gln Asp Gln Val
420 425 430
Asp Ser Leu Ala Glu Val Val Leu Gln Asn Arg Arg Gly Leu Asp Leu
435 440 445
Leu Thr Ala Glu Gln Gly Gly Ile Cys Leu Ala Leu Gln Glu Lys Cys
450 455 460
Cys Phe Tyr Val Asn Lys Ser Gly Ile Val Arg Asp Lys Ile Lys Thr
465 470 475 480
Leu Gln Glu Glu Leu Glu Arg Arg Arg Lys Asp Leu Ala Ser Asn Pro
485 490 495
Leu Trp Thr Gly Leu Gln Gly Leu Leu Pro Tyr Leu Leu Pro Phe Leu
500 505 510
Gly Pro Leu Leu Thr Leu Leu Leu Leu Leu Thr Ile Gly Pro Cys Ile
515 520 525
Phe Asn Arg Leu Thr Ala Phe Ile Asn Asp Lys Leu Asn Ile Ile His
530 535 540
Ala Met Val Leu Thr Gln Gln Tyr Gln Val Leu Arg Thr Asp Glu Glu
545 550 555 560
Ala Gln Asp
<210> 457
<211> 2958
<212> DNA
<213> Spumavirus Human Foamy Virus
<400> 457
atgacactgc aacaatggat catttggaaa aaaatgaata aagcgcatga ggcacttcaa 60
aatacaacaa ctgtgactga acagcagaag gaacaaatta tactggacat tcaaaatgaa 120
gaagtacaac caactaggag agataaattt agatatctgc tttatacttg ttgtgctact 180
agctcaagag tattggcctg gatgttttta gtttgtatat tgttaatcat tgttttggtt 240
tcatgctttg tgactatatc cagaatacaa tggaataagg atattcaggt attaggacct 300
gtaatagact ggaatgttac tcaaagagct gtttatcaac ccttacagac tagaaggatt 360
gcacgttccc ttagaatgca gcatcctgtt ccaaaatatg tggaggtaaa tatgactagt 420
attccacaag gtgtatacta tgaaccccat ccggaaccca tagtggtgaa ggagagggtc 480
ctaggtcttt ctcaaattct gatgattaat tcagaaaaca ttgctaataa tgctaatttg 540
acacaagaag taaagaagtt gttaactgaa atggttaatg aagaaatgca aagtttgtca 600
gatgtaatga ttgactttga aattccttta ggagaccctc gtgatcaaga acaatatata 660
catagaaaat gctatcaaga atttgcaaat tgttatttag taaaatataa agaacccaaa 720
ccgtggccta aggagggcct tatagctgat caatgcccat taccaggtta ccatgctgga 780
ttaacctata atagacagtc tatttgggat tactatatta aagtggagag tattagacct 840
gcaaattgga caacaaagag taaatatgga caagctagac taggaagttt ttatattcct 900
agcagcctga gacaaatcaa tgttagtcat gtactattct gtagtgatca attatattct 960
aaatggtata atatagaaaa taccatagaa caaaacgagc ggtttctgct taataaacta 1020
aataacctta catctggaac ctcagtattg aagaaaagag ctcttccgaa ggattggagt 1080
tctcaaggta aaaatgctct gtttagagaa atcaatgtgt tagatatctg cagtaaacct 1140
gaatctgtaa tactattgaa tacttcatac tattccttct ctttatggga aggagattgt 1200
aattttacta aagatatgat ttctcagttg gttccagaat gtgatggatt ttataacaat 1260
tctaagtgga tgcatatgca tccatatgct tgtagattct ggagaagtaa gaagaatgaa 1320
aaagaagaaa ctaaatgtag agatggggaa actaagagat gtctgtatta tcctttatgg 1380
gacagtcccg aatctacata tgattttggt tatttagcat accaaaagaa ttttccttcc 1440
cctatctgta tagaacaaca gaaaattaga gatcaagatt atgaagtcta ttctttgtat 1500
caagaacgca aaatagcttc taaagcatat ggaattgata cagttttatt ctctctaaag 1560
aattttctta attatacagg aactcctgta aatgaaatgc ctaatgcaag agcttttgta 1620
ggcctaatag atcccaagtt tcctccttcc tatcccaatg ttactaggga acattatact 1680
tcctgtaata ataggaaaag aagaagtgtt gataataact atgctaagtt aaggtctatg 1740
gggtatgcac ttacaggagc agtgcaaacc ttatctcaaa tatcagatat taatgatgaa 1800
aacttacagc aaggaatata tttattaagg gatcatgtaa taaccttaat ggaagctaca 1860
ttgcatgata tatctgttat ggaaggaatg tttgctgtac aacatttgca tacacatttg 1920
aatcatttga agacaatgct tctagaaaga agaatagact ggacctatat gtctagtact 1980
tggctacaac aacaattaca gaaatctgat gatgagatga aagtaataaa gagaattgct 2040
agaagtttgg tatattatgt taaacaaacc catagttctc ccacagctac agcctgggag 2100
attggattat attatgaatt ggttatacct aaacatattt acttgaataa ttggaatgtt 2160
gtcaatatag gtcacttagt taaatcagct ggacaattga ctcatgtaac tatagctcat 2220
ccttatgaaa taatcaataa ggaatgtgta gagactatat atctgcatct tgaggactgc 2280
acaagacaag attatgtcat atgtgatgtg gtaaagatag tgcagccttg tggcaatagc 2340
tcagacacga gtgattgtcc tgtctgggct gaagctgtaa aagaaccatt tgtgcaagtc 2400
aatcctctga aaaacggaag ttatctggtt ttggcaagtt ccacagactg tcagatccca 2460
ccatatgttc ctagcatcgt gactgttaat gaaacaacgt catgctttgg actggacttt 2520
aaaaggccac tggttgcgga agaaagattg agctttgagc cacgactgcc aaatctacaa 2580
ctaagattac cacatttggt tggaattatt gcaaaaatca aagggataaa aatagaagtc 2640
acatcctctg gagaaagtat aaaagagcag attgaaagag caaaagctga gctccttcga 2700
ctggacattc acgagggaga tactcctgcc tggatacaac agctagctgc agcaacaaag 2760
gacgtctggc cagcagcagc ttctgctcta caaggaattg gtaacttttt atctgggact 2820
gcccaaggaa tatttggaac tgcctttagt ctcttgggat acttaaagcc tatcctaata 2880
ggagtagggg tcattctctt ggttattctt atatttaaga ttgtatcatg gattcctacg 2940
aaaaagaaga atcagtag 2958
<210> 458
<211> 985
<212> PRT
<213> Spumavirus Human Foamy Virus
<400> 458
Met Thr Leu Gln Gln Trp Ile Ile Trp Lys Lys Met Asn Lys Ala His
1 5 10 15
Glu Ala Leu Gln Asn Thr Thr Thr Val Thr Glu Gln Gln Lys Glu Gln
20 25 30
Ile Ile Leu Asp Ile Gln Asn Glu Glu Val Gln Pro Thr Arg Arg Asp
35 40 45
Lys Phe Arg Tyr Leu Leu Tyr Thr Cys Cys Ala Thr Ser Ser Arg Val
50 55 60
Leu Ala Trp Met Phe Leu Val Cys Ile Leu Leu Ile Ile Val Leu Val
65 70 75 80
Ser Cys Phe Val Thr Ile Ser Arg Ile Gln Trp Asn Lys Asp Ile Gln
85 90 95
Val Leu Gly Pro Val Ile Asp Trp Asn Val Thr Gln Arg Ala Val Tyr
100 105 110
Gln Pro Leu Gln Thr Arg Arg Ile Ala Arg Ser Leu Arg Met Gln His
115 120 125
Pro Val Pro Lys Tyr Val Glu Val Asn Met Thr Ser Ile Pro Gln Gly
130 135 140
Val Tyr Tyr Glu Pro His Pro Glu Pro Ile Val Val Lys Glu Arg Val
145 150 155 160
Leu Gly Leu Ser Gln Ile Leu Met Ile Asn Ser Glu Asn Ile Ala Asn
165 170 175
Asn Ala Asn Leu Thr Gln Glu Val Lys Lys Leu Leu Thr Glu Met Val
180 185 190
Asn Glu Glu Met Gln Ser Leu Ser Asp Val Met Ile Asp Phe Glu Ile
195 200 205
Pro Leu Gly Asp Pro Arg Asp Gln Glu Gln Tyr Ile His Arg Lys Cys
210 215 220
Tyr Gln Glu Phe Ala Asn Cys Tyr Leu Val Lys Tyr Lys Glu Pro Lys
225 230 235 240
Pro Trp Pro Lys Glu Gly Leu Ile Ala Asp Gln Cys Pro Leu Pro Gly
245 250 255
Tyr His Ala Gly Leu Thr Tyr Asn Arg Gln Ser Ile Trp Asp Tyr Tyr
260 265 270
Ile Lys Val Glu Ser Ile Arg Pro Ala Asn Trp Thr Thr Lys Ser Lys
275 280 285
Tyr Gly Gln Ala Arg Leu Gly Ser Phe Tyr Ile Pro Ser Ser Leu Arg
290 295 300
Gln Ile Asn Val Ser His Val Leu Phe Cys Ser Asp Gln Leu Tyr Ser
305 310 315 320
Lys Trp Tyr Asn Ile Glu Asn Thr Ile Glu Gln Asn Glu Arg Phe Leu
325 330 335
Leu Asn Lys Leu Asn Asn Leu Thr Ser Gly Thr Ser Val Leu Lys Lys
340 345 350
Arg Ala Leu Pro Lys Asp Trp Ser Ser Gln Gly Lys Asn Ala Leu Phe
355 360 365
Arg Glu Ile Asn Val Leu Asp Ile Cys Ser Lys Pro Glu Ser Val Ile
370 375 380
Leu Leu Asn Thr Ser Tyr Tyr Ser Phe Ser Leu Trp Glu Gly Asp Cys
385 390 395 400
Asn Phe Thr Lys Asp Met Ile Ser Gln Leu Val Pro Glu Cys Asp Gly
405 410 415
Phe Tyr Asn Asn Ser Lys Trp Met His Met His Pro Tyr Ala Cys Arg
420 425 430
Phe Trp Arg Ser Lys Lys Asn Glu Lys Glu Glu Thr Lys Cys Arg Asp
435 440 445
Gly Glu Thr Lys Arg Cys Leu Tyr Tyr Pro Leu Trp Asp Ser Pro Glu
450 455 460
Ser Thr Tyr Asp Phe Gly Tyr Leu Ala Tyr Gln Lys Asn Phe Pro Ser
465 470 475 480
Pro Ile Cys Ile Glu Gln Gln Lys Ile Arg Asp Gln Asp Tyr Glu Val
485 490 495
Tyr Ser Leu Tyr Gln Glu Arg Lys Ile Ala Ser Lys Ala Tyr Gly Ile
500 505 510
Asp Thr Val Leu Phe Ser Leu Lys Asn Phe Leu Asn Tyr Thr Gly Thr
515 520 525
Pro Val Asn Glu Met Pro Asn Ala Arg Ala Phe Val Gly Leu Ile Asp
530 535 540
Pro Lys Phe Pro Pro Ser Tyr Pro Asn Val Thr Arg Glu His Tyr Thr
545 550 555 560
Ser Cys Asn Asn Arg Lys Arg Arg Ser Val Asp Asn Asn Tyr Ala Lys
565 570 575
Leu Arg Ser Met Gly Tyr Ala Leu Thr Gly Ala Val Gln Thr Leu Ser
580 585 590
Gln Ile Ser Asp Ile Asn Asp Glu Asn Leu Gln Gln Gly Ile Tyr Leu
595 600 605
Leu Arg Asp His Val Ile Thr Leu Met Glu Ala Thr Leu His Asp Ile
610 615 620
Ser Val Met Glu Gly Met Phe Ala Val Gln His Leu His Thr His Leu
625 630 635 640
Asn His Leu Lys Thr Met Leu Leu Glu Arg Arg Ile Asp Trp Thr Tyr
645 650 655
Met Ser Ser Thr Trp Leu Gln Gln Gln Leu Gln Lys Ser Asp Asp Glu
660 665 670
Met Lys Val Ile Lys Arg Ile Ala Arg Ser Leu Val Tyr Tyr Val Lys
675 680 685
Gln Thr His Ser Ser Pro Thr Ala Thr Ala Trp Glu Ile Gly Leu Tyr
690 695 700
Tyr Glu Leu Val Ile Pro Lys His Ile Tyr Leu Asn Asn Trp Asn Val
705 710 715 720
Val Asn Ile Gly His Leu Val Lys Ser Ala Gly Gln Leu Thr His Val
725 730 735
Thr Ile Ala His Pro Tyr Glu Ile Ile Asn Lys Glu Cys Val Glu Thr
740 745 750
Ile Tyr Leu His Leu Glu Asp Cys Thr Arg Gln Asp Tyr Val Ile Cys
755 760 765
Asp Val Val Lys Ile Val Gln Pro Cys Gly Asn Ser Ser Asp Thr Ser
770 775 780
Asp Cys Pro Val Trp Ala Glu Ala Val Lys Glu Pro Phe Val Gln Val
785 790 795 800
Asn Pro Leu Lys Asn Gly Ser Tyr Leu Val Leu Ala Ser Ser Thr Asp
805 810 815
Cys Gln Ile Pro Pro Tyr Val Pro Ser Ile Val Thr Val Asn Glu Thr
820 825 830
Thr Ser Cys Phe Gly Leu Asp Phe Lys Arg Pro Leu Val Ala Glu Glu
835 840 845
Arg Leu Ser Phe Glu Pro Arg Leu Pro Asn Leu Gln Leu Arg Leu Pro
850 855 860
His Leu Val Gly Ile Ile Ala Lys Ile Lys Gly Ile Lys Ile Glu Val
865 870 875 880
Thr Ser Ser Gly Glu Ser Ile Lys Glu Gln Ile Glu Arg Ala Lys Ala
885 890 895
Glu Leu Leu Arg Leu Asp Ile His Glu Gly Asp Thr Pro Ala Trp Ile
900 905 910
Gln Gln Leu Ala Ala Ala Thr Lys Asp Val Trp Pro Ala Ala Ala Ser
915 920 925
Ala Leu Gln Gly Ile Gly Asn Phe Leu Ser Gly Thr Ala Gln Gly Ile
930 935 940
Phe Gly Thr Ala Phe Ser Leu Leu Gly Tyr Leu Lys Pro Ile Leu Ile
945 950 955 960
Gly Val Gly Val Ile Leu Leu Val Ile Leu Ile Phe Lys Ile Val Ser
965 970 975
Trp Ile Pro Thr Lys Lys Lys Asn Gln
980 985
<210> 459
<211> 2742
<212> DNA
<213> Varicellovirus Pseudorabies virus
<400> 459
atgcctgcag gtggcggatt gtggagagga ccaaggggac atagacctgg acatcatggt 60
ggggcaggtt tgggtaggct ctggccagca cctcatcatg ccgccgccgc tagaggggca 120
gttgcactgg ctcttttgct cctcgcactg gcagcagctc caccatgtgg agccgcagct 180
gttacacgcg ctgctagtgc atctcccacc ccgggcaccg gagcaacgcc aaatgatgtg 240
agcgctgaag ctagtcttga agaaatagaa gcttttagcc ctgggcctag cgaagctcct 300
gatggtgaat atggagatct tgatgcacgt acagcagtcc gagcagcggc cactgaacgc 360
gataggtttt atgtttgtcc cccaccaagc ggaagcactg ttgttagact tgaaccagaa 420
caagcatgtc ctgaatatag ccaaggcagg aattttaccg aaggtatagc agtcctgttt 480
aaagaaaata tcgctcccca taagtttaaa gctcacatat actacaagaa tgtgatagtg 540
acaacagtct ggagtggaag tacctatgca gctattacca atcggtttac ggatcgggta 600
cctgtgcctg tacaagaaat aacagatgta atagataggc gcgggaaatg tgtgagcaaa 660
gcagaatatg taagaaacaa tcataaagtt acagcttttg accgagatga aaatccggta 720
gaagtagatc tccgaccttc ccggctcaat gctctgggta cgcggggatg gcatacaaca 780
aatgatactt atacaaagat aggagcggca ggattttatc ataccgggac aagcgttaat 840
tgtattgtgg aagaagtaga agcacgatct gtctatccat atgattcatt tgcactctct 900
acaggcgata tagtctatat gagccctttc tatgggctcc gtgaaggagc tcatggcgaa 960
catatagggt atgcccctgg caggtttcaa caagtcgaac attattatcc aattgatctt 1020
gattcccggc tgcgggctag tgaatcagtt acaagaaatt tcctgcggac ccctcatttt 1080
accgtagcat gggattgggc acccaaaact cgtagagtct gtagtttggc gaaatggcgt 1140
gaagcggaag aaatgacacg ggatgaaacc cgagatggat catttcgatt tacctcacgt 1200
gctctcggag cttcatttgt atctgatgtt acccaactcg atctccaacg ggtccatctt 1260
ggggattgtg tactgagaga agcgagcgaa gcgattgatg ctatttatcg ccgccgatat 1320
aatagtaccc atgtccttgc gggagatcgt ccggaagttt atctggcgag aggtgggttt 1380
gttgtagcat ttcgacctct cattagcaat gaactcgccc aattgtatgc acgagaactg 1440
gaaagattgg gactggcggg agttgttgga ccagctgctc ctgctgcagc aagacgtgct 1500
agaaggtctc ctggtcctgc cggtaccccg gaaccacccg cagttaatgg gaccggtcat 1560
ttgaggataa caactgggag cgccgagttc gctcggctcc aatttactta tgatcatatt 1620
caagcacatg tcaatgatat gctcggtagg atagcagcgg catggtgtga actccaaaat 1680
aaagatcgaa cactctggtc tgaaatgtca cggctcaatc catccgctgt tgcaacagcg 1740
gcactgggtc aacgagtgtc agcaaggatg ctgggcgatg taatggctat ttctaggtgt 1800
gttgaagtcc ggggtggggt atatgttcaa aattctatgc gtgtcccagg tgaaagaggt 1860
acctgttatt cccgacccct tgtaactttt gaacataatg gaacaggtgt catagaagga 1920
caacttgggg atgataatga actgctgatt tcacgtgatc tgattgaacc ttgtactggt 1980
aatcatcgca ggtatttcaa actgggatct ggatatgtct attatgaaga ttataactat 2040
gtaaggatgg tcgaagttcc ggaaaccatt tccaccaggg tcacactcaa tctcacactc 2100
ctcgaagata gagaatttct tcctcttgaa gtctatacac gggaagaact ggctgatact 2160
gggctgcttg attattccga aattcaacga cgaaatcaac ttcacgccct gaaattttat 2220
gatattgata gggtagttaa agtcgatcac aatgttgtat tgctccgtgg aattgcaaat 2280
ttctttcaag gtcttgggga tgttggagca gctgtgggga aagtcgtgct cggcgctact 2340
ggcgcggtta tttctgcggt gggcgggatg gttagctttc tctctaatcc ttttggagct 2400
ctggcaattg gtcttttggt cttggcgggg cttgttgctg catttcttgc atataggcat 2460
attagcagac ttagaaggaa tccaatgaaa gcactctatc ctgtgactac caaaacactg 2520
aaagaagatg gtgtggatga gggagatgtc gatgaagcaa aacttgatca agctagagat 2580
atgattcgct atatgtctat tgtctcagca cttgaacaac aagaacataa agcaaggaag 2640
aagaatagtg gcccagcact ccttgcgtca agagtgggcg ccatggcaac aaggagacga 2700
cattatcaaa ggctggaaag tgaagatcca gatgcgttgt aa 2742
<210> 460
<211> 913
<212> PRT
<213> Varicellovirus Pseudorabies virus
<400> 460
Met Pro Ala Gly Gly Gly Leu Trp Arg Gly Pro Arg Gly His Arg Pro
1 5 10 15
Gly His His Gly Gly Ala Gly Leu Gly Arg Leu Trp Pro Ala Pro His
20 25 30
His Ala Ala Ala Ala Arg Gly Ala Val Ala Leu Ala Leu Leu Leu Leu
35 40 45
Ala Leu Ala Ala Ala Pro Pro Cys Gly Ala Ala Ala Val Thr Arg Ala
50 55 60
Ala Ser Ala Ser Pro Thr Pro Gly Thr Gly Ala Thr Pro Asn Asp Val
65 70 75 80
Ser Ala Glu Ala Ser Leu Glu Glu Ile Glu Ala Phe Ser Pro Gly Pro
85 90 95
Ser Glu Ala Pro Asp Gly Glu Tyr Gly Asp Leu Asp Ala Arg Thr Ala
100 105 110
Val Arg Ala Ala Ala Thr Glu Arg Asp Arg Phe Tyr Val Cys Pro Pro
115 120 125
Pro Ser Gly Ser Thr Val Val Arg Leu Glu Pro Glu Gln Ala Cys Pro
130 135 140
Glu Tyr Ser Gln Gly Arg Asn Phe Thr Glu Gly Ile Ala Val Leu Phe
145 150 155 160
Lys Glu Asn Ile Ala Pro His Lys Phe Lys Ala His Ile Tyr Tyr Lys
165 170 175
Asn Val Ile Val Thr Thr Val Trp Ser Gly Ser Thr Tyr Ala Ala Ile
180 185 190
Thr Asn Arg Phe Thr Asp Arg Val Pro Val Pro Val Gln Glu Ile Thr
195 200 205
Asp Val Ile Asp Arg Arg Gly Lys Cys Val Ser Lys Ala Glu Tyr Val
210 215 220
Arg Asn Asn His Lys Val Thr Ala Phe Asp Arg Asp Glu Asn Pro Val
225 230 235 240
Glu Val Asp Leu Arg Pro Ser Arg Leu Asn Ala Leu Gly Thr Arg Gly
245 250 255
Trp His Thr Thr Asn Asp Thr Tyr Thr Lys Ile Gly Ala Ala Gly Phe
260 265 270
Tyr His Thr Gly Thr Ser Val Asn Cys Ile Val Glu Glu Val Glu Ala
275 280 285
Arg Ser Val Tyr Pro Tyr Asp Ser Phe Ala Leu Ser Thr Gly Asp Ile
290 295 300
Val Tyr Met Ser Pro Phe Tyr Gly Leu Arg Glu Gly Ala His Gly Glu
305 310 315 320
His Ile Gly Tyr Ala Pro Gly Arg Phe Gln Gln Val Glu His Tyr Tyr
325 330 335
Pro Ile Asp Leu Asp Ser Arg Leu Arg Ala Ser Glu Ser Val Thr Arg
340 345 350
Asn Phe Leu Arg Thr Pro His Phe Thr Val Ala Trp Asp Trp Ala Pro
355 360 365
Lys Thr Arg Arg Val Cys Ser Leu Ala Lys Trp Arg Glu Ala Glu Glu
370 375 380
Met Thr Arg Asp Glu Thr Arg Asp Gly Ser Phe Arg Phe Thr Ser Arg
385 390 395 400
Ala Leu Gly Ala Ser Phe Val Ser Asp Val Thr Gln Leu Asp Leu Gln
405 410 415
Arg Val His Leu Gly Asp Cys Val Leu Arg Glu Ala Ser Glu Ala Ile
420 425 430
Asp Ala Ile Tyr Arg Arg Arg Tyr Asn Ser Thr His Val Leu Ala Gly
435 440 445
Asp Arg Pro Glu Val Tyr Leu Ala Arg Gly Gly Phe Val Val Ala Phe
450 455 460
Arg Pro Leu Ile Ser Asn Glu Leu Ala Gln Leu Tyr Ala Arg Glu Leu
465 470 475 480
Glu Arg Leu Gly Leu Ala Gly Val Val Gly Pro Ala Ala Pro Ala Ala
485 490 495
Ala Arg Arg Ala Arg Arg Ser Pro Gly Pro Ala Gly Thr Pro Glu Pro
500 505 510
Pro Ala Val Asn Gly Thr Gly His Leu Arg Ile Thr Thr Gly Ser Ala
515 520 525
Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asp His Ile Gln Ala His Val
530 535 540
Asn Asp Met Leu Gly Arg Ile Ala Ala Ala Trp Cys Glu Leu Gln Asn
545 550 555 560
Lys Asp Arg Thr Leu Trp Ser Glu Met Ser Arg Leu Asn Pro Ser Ala
565 570 575
Val Ala Thr Ala Ala Leu Gly Gln Arg Val Ser Ala Arg Met Leu Gly
580 585 590
Asp Val Met Ala Ile Ser Arg Cys Val Glu Val Arg Gly Gly Val Tyr
595 600 605
Val Gln Asn Ser Met Arg Val Pro Gly Glu Arg Gly Thr Cys Tyr Ser
610 615 620
Arg Pro Leu Val Thr Phe Glu His Asn Gly Thr Gly Val Ile Glu Gly
625 630 635 640
Gln Leu Gly Asp Asp Asn Glu Leu Leu Ile Ser Arg Asp Leu Ile Glu
645 650 655
Pro Cys Thr Gly Asn His Arg Arg Tyr Phe Lys Leu Gly Ser Gly Tyr
660 665 670
Val Tyr Tyr Glu Asp Tyr Asn Tyr Val Arg Met Val Glu Val Pro Glu
675 680 685
Thr Ile Ser Thr Arg Val Thr Leu Asn Leu Thr Leu Leu Glu Asp Arg
690 695 700
Glu Phe Leu Pro Leu Glu Val Tyr Thr Arg Glu Glu Leu Ala Asp Thr
705 710 715 720
Gly Leu Leu Asp Tyr Ser Glu Ile Gln Arg Arg Asn Gln Leu His Ala
725 730 735
Leu Lys Phe Tyr Asp Ile Asp Arg Val Val Lys Val Asp His Asn Val
740 745 750
Val Leu Leu Arg Gly Ile Ala Asn Phe Phe Gln Gly Leu Gly Asp Val
755 760 765
Gly Ala Ala Val Gly Lys Val Val Leu Gly Ala Thr Gly Ala Val Ile
770 775 780
Ser Ala Val Gly Gly Met Val Ser Phe Leu Ser Asn Pro Phe Gly Ala
785 790 795 800
Leu Ala Ile Gly Leu Leu Val Leu Ala Gly Leu Val Ala Ala Phe Leu
805 810 815
Ala Tyr Arg His Ile Ser Arg Leu Arg Arg Asn Pro Met Lys Ala Leu
820 825 830
Tyr Pro Val Thr Thr Lys Thr Leu Lys Glu Asp Gly Val Asp Glu Gly
835 840 845
Asp Val Asp Glu Ala Lys Leu Asp Gln Ala Arg Asp Met Ile Arg Tyr
850 855 860
Met Ser Ile Val Ser Ala Leu Glu Gln Gln Glu His Lys Ala Arg Lys
865 870 875 880
Lys Asn Ser Gly Pro Ala Leu Leu Ala Ser Arg Val Gly Ala Met Ala
885 890 895
Thr Arg Arg Arg His Tyr Gln Arg Leu Glu Ser Glu Asp Pro Asp Ala
900 905 910
Leu
<210> 461
<211> 1203
<212> DNA
<213> Varicellovirus Pseudorabies virus
<400> 461
atgttgcttg ctgctctcct ggctgctctc gtcgcacgca caacgcttgg ggccgatgta 60
gatgctgttc ctgctcctac atttccaccc ccagcctatc catatacaga atcctggcaa 120
cttacattga ctaccgttcc aagtccgttt gtggggcctg ccgatgtgta tcatacacgg 180
ccattggaag atccatgtgg tgtcgtagcc ttgatttctg atccccaagt cgatcgactt 240
cttaatgaag cagtcgctca tcgtagacct acctatagag ctcatgtcgc ttggtatagg 300
atagcagatg gctgtgccca tctcctctat ttcattgaat atgcagattg tgatccacgg 360
caaatattcg gccggtgtcg caggcggaca acacctatgt ggtggacacc aagtgcagat 420
tatatgtttc ctaccgaaga tgaattgggt ttgctgatgg tagcgcccgg caggtttaat 480
gaagggcaat atcgcagact cgtctcagtg gatggagtaa atattcttac agattttatg 540
gtcgctctgc cagaaggaca ggaatgtcct tttgcgagag tcgatcaaca tcggacatat 600
aaatttggtg cttgttggaa tgatgaatct tttcgcagag gagttgatgt tatgcgtttt 660
ctcactccat tttatcaaca accaccccat cgtgaagtcg taaattattg gtataggaag 720
aatggacgca ccctgccaag ggcgtatgct gcggcaacac cttatgcaat agatccagcc 780
agaccttcag ccggatcacc tcgcccaaga ccaagaccta ggcctcgtcc caaaccggaa 840
ccagcgcccg ttacacctgc tccacctggg aggctccctg aacccgcaac aagagatcat 900
gcagctggcg ggcatccaac acctaggcca ccccgaccag aaacacccca taggccattt 960
gcgccaccag cggtggttcc atctggatgg ccccaacctg ccgaaccttt tcaaccacgc 1020
actccagcag cccccggagt gtctcgtcat cggagcgtca ttgtgggaac tggtactgct 1080
atgggtgccc tgttggtagg agtttgtgtg tatatattct ttcggcttcg aggcgctaaa 1140
ggctacaggc tgttgggtgg cccagctgat acggatgaac tcaaggccca accagggcca 1200
taa 1203
<210> 462
<211> 400
<212> PRT
<213> Varicellovirus Pseudorabies virus
<400> 462
Met Leu Leu Ala Ala Leu Leu Ala Ala Leu Val Ala Arg Thr Thr Leu
1 5 10 15
Gly Ala Asp Val Asp Ala Val Pro Ala Pro Thr Phe Pro Pro Pro Ala
20 25 30
Tyr Pro Tyr Thr Glu Ser Trp Gln Leu Thr Leu Thr Thr Val Pro Ser
35 40 45
Pro Phe Val Gly Pro Ala Asp Val Tyr His Thr Arg Pro Leu Glu Asp
50 55 60
Pro Cys Gly Val Val Ala Leu Ile Ser Asp Pro Gln Val Asp Arg Leu
65 70 75 80
Leu Asn Glu Ala Val Ala His Arg Arg Pro Thr Tyr Arg Ala His Val
85 90 95
Ala Trp Tyr Arg Ile Ala Asp Gly Cys Ala His Leu Leu Tyr Phe Ile
100 105 110
Glu Tyr Ala Asp Cys Asp Pro Arg Gln Ile Phe Gly Arg Cys Arg Arg
115 120 125
Arg Thr Thr Pro Met Trp Trp Thr Pro Ser Ala Asp Tyr Met Phe Pro
130 135 140
Thr Glu Asp Glu Leu Gly Leu Leu Met Val Ala Pro Gly Arg Phe Asn
145 150 155 160
Glu Gly Gln Tyr Arg Arg Leu Val Ser Val Asp Gly Val Asn Ile Leu
165 170 175
Thr Asp Phe Met Val Ala Leu Pro Glu Gly Gln Glu Cys Pro Phe Ala
180 185 190
Arg Val Asp Gln His Arg Thr Tyr Lys Phe Gly Ala Cys Trp Asn Asp
195 200 205
Glu Ser Phe Arg Arg Gly Val Asp Val Met Arg Phe Leu Thr Pro Phe
210 215 220
Tyr Gln Gln Pro Pro His Arg Glu Val Val Asn Tyr Trp Tyr Arg Lys
225 230 235 240
Asn Gly Arg Thr Leu Pro Arg Ala Tyr Ala Ala Ala Thr Pro Tyr Ala
245 250 255
Ile Asp Pro Ala Arg Pro Ser Ala Gly Ser Pro Arg Pro Arg Pro Arg
260 265 270
Pro Arg Pro Arg Pro Lys Pro Glu Pro Ala Pro Val Thr Pro Ala Pro
275 280 285
Pro Gly Arg Leu Pro Glu Pro Ala Thr Arg Asp His Ala Ala Gly Gly
290 295 300
His Pro Thr Pro Arg Pro Pro Arg Pro Glu Thr Pro His Arg Pro Phe
305 310 315 320
Ala Pro Pro Ala Val Val Pro Ser Gly Trp Pro Gln Pro Ala Glu Pro
325 330 335
Phe Gln Pro Arg Thr Pro Ala Ala Pro Gly Val Ser Arg His Arg Ser
340 345 350
Val Ile Val Gly Thr Gly Thr Ala Met Gly Ala Leu Leu Val Gly Val
355 360 365
Cys Val Tyr Ile Phe Phe Arg Leu Arg Gly Ala Lys Gly Tyr Arg Leu
370 375 380
Leu Gly Gly Pro Ala Asp Thr Asp Glu Leu Lys Ala Gln Pro Gly Pro
385 390 395 400
<210> 463
<211> 2061
<212> DNA
<213> Varicellovirus Pseudorabies virus
<400> 463
atgcccgcca gttcagtccg gctccctctg cggttgctta ctcttgccgg tcttttggct 60
cttgctggcg cagcagctct ggctcgagga gctccacaag gcggtccacc atcaccccaa 120
ggcgggcctg ctccgacagc tgctccagca agaggaccta cactctttgt gcttgtaggt 180
gatggatcag catggtttgt gtttcaactg ggtggcttgg gagccctgaa tgatacaaga 240
ataaggggac atctcctggg aaggtatctg gtttcatatc aagtagtacc cccacctgtg 300
tcagcttggt atttcgtaca acgtcccaga gaacggccta ggcttagcgg accaccttca 360
ggagctgaac tggtagcttt tgatgcccct ggggtgagaa ggacatatac aaccgctgcc 420
gtttggcctg ccgaagttgc tgttctggca gatgctgaag ccaggtgtcc agctgcagtt 480
ttcaatgtta ccctcgggga agcgtttctg ggtttgaggg tggcattgcg gagcttcttg 540
ccactcgaag tgattattag cgctgaaagg atgcggatga ttgcaccgcc cgcccttggt 600
tccgatctcg aacccccagg gccacctgcc gggcggtttc atgtctatac actgggattt 660
ctgagcgatg gcgctatgca tcaaacaatg agagatgtcg cggcatatgt ccatgaatcc 720
gatgattatc tggctcaact ttcagctgct catgccgcgg ctcttgctgc agtcgtccaa 780
cctggtccat attatttcta tcgggccgcc gtccgactgg gagtagcggc atttgtgttt 840
tcagaagccg ctcgaaggga tagacgggcg agcgcccctg ccctgctccg agtagaatcc 900
gatgctagac tcctttcaag actcctgatg agggccgctg ggtgtcctgc agggtttgca 960
ggtctgtttg atggacgtgc tgaacgagtg cctgtcgctc ctgccgatca actgcgggca 1020
gcatggacat ttggggaaga tcctgcaccg cgtcttgatc tggcaagagc aacggtggca 1080
gaagcctata ggagatctgt tcgaggaaaa ccgtttgatc aacaagccct gttcttcgca 1140
gtggcattgc tcctcagggc aggtgggcct ggggatgcca gagaaactct cctcagaaca 1200
accgcaatgt gtactgctga acgggcagcg gcagcggcgg aactgacaag agcggccctg 1260
agccccaccg cggcctggaa tgaaccattt tccttgttgg atgtgcttag cccatgtgct 1320
gtgtctctca gaagggatct tggcggagat gctacattgg caaatctcgg ggctgcagcc 1380
agattggccc tcgcaccagc gggcgcacct ggggcagctg ccgccactga tgaaggagca 1440
gaagaagaag aagaagatcc ggtggcaaga gcggccccgg aaattccagc tgaagctctc 1500
ttggcgctcc ctctccgagg cggggcatct tttgtcttta caagacgccg acccgattgt 1560
ggacccgcct atacccttgg tggagttgat attgctaatc ctctggtcct tgcaattgtt 1620
tcaaatgatt ccgcagcctg tgattatacc gacagaatgc ctgaaagcca acatcttcct 1680
gccaccgata atcccagcgt ctgtgtttat tgtgattgtg tctttgtcag gtattcaagt 1740
gctgggacca ttctcgaaac tgtgctgata gaaagtaaag atatggaaga acaattgatg 1800
gctggggcta attctactat tccatcattt aatccaacac ttcatggtgg ggatgtgaaa 1860
gctcttatgc tgtttcctaa tggaacagtt gttgatcttt tgagctttac ctctaccaga 1920
ctggcacctg tcagccccgc ttatgttgtt gcatcagttg taggtgccgc tattactgtc 1980
ggcattcttt atgcactttt caaaatgctt tgttcattta gcagtgaagg gtacagcaga 2040
cttattaatg cacgcagcta g 2061
<210> 464
<211> 686
<212> PRT
<213> Varicellovirus Pseudorabies virus
<400> 464
Met Pro Ala Ser Ser Val Arg Leu Pro Leu Arg Leu Leu Thr Leu Ala
1 5 10 15
Gly Leu Leu Ala Leu Ala Gly Ala Ala Ala Leu Ala Arg Gly Ala Pro
20 25 30
Gln Gly Gly Pro Pro Ser Pro Gln Gly Gly Pro Ala Pro Thr Ala Ala
35 40 45
Pro Ala Arg Gly Pro Thr Leu Phe Val Leu Val Gly Asp Gly Ser Ala
50 55 60
Trp Phe Val Phe Gln Leu Gly Gly Leu Gly Ala Leu Asn Asp Thr Arg
65 70 75 80
Ile Arg Gly His Leu Leu Gly Arg Tyr Leu Val Ser Tyr Gln Val Val
85 90 95
Pro Pro Pro Val Ser Ala Trp Tyr Phe Val Gln Arg Pro Arg Glu Arg
100 105 110
Pro Arg Leu Ser Gly Pro Pro Ser Gly Ala Glu Leu Val Ala Phe Asp
115 120 125
Ala Pro Gly Val Arg Arg Thr Tyr Thr Thr Ala Ala Val Trp Pro Ala
130 135 140
Glu Val Ala Val Leu Ala Asp Ala Glu Ala Arg Cys Pro Ala Ala Val
145 150 155 160
Phe Asn Val Thr Leu Gly Glu Ala Phe Leu Gly Leu Arg Val Ala Leu
165 170 175
Arg Ser Phe Leu Pro Leu Glu Val Ile Ile Ser Ala Glu Arg Met Arg
180 185 190
Met Ile Ala Pro Pro Ala Leu Gly Ser Asp Leu Glu Pro Pro Gly Pro
195 200 205
Pro Ala Gly Arg Phe His Val Tyr Thr Leu Gly Phe Leu Ser Asp Gly
210 215 220
Ala Met His Gln Thr Met Arg Asp Val Ala Ala Tyr Val His Glu Ser
225 230 235 240
Asp Asp Tyr Leu Ala Gln Leu Ser Ala Ala His Ala Ala Ala Leu Ala
245 250 255
Ala Val Val Gln Pro Gly Pro Tyr Tyr Phe Tyr Arg Ala Ala Val Arg
260 265 270
Leu Gly Val Ala Ala Phe Val Phe Ser Glu Ala Ala Arg Arg Asp Arg
275 280 285
Arg Ala Ser Ala Pro Ala Leu Leu Arg Val Glu Ser Asp Ala Arg Leu
290 295 300
Leu Ser Arg Leu Leu Met Arg Ala Ala Gly Cys Pro Ala Gly Phe Ala
305 310 315 320
Gly Leu Phe Asp Gly Arg Ala Glu Arg Val Pro Val Ala Pro Ala Asp
325 330 335
Gln Leu Arg Ala Ala Trp Thr Phe Gly Glu Asp Pro Ala Pro Arg Leu
340 345 350
Asp Leu Ala Arg Ala Thr Val Ala Glu Ala Tyr Arg Arg Ser Val Arg
355 360 365
Gly Lys Pro Phe Asp Gln Gln Ala Leu Phe Phe Ala Val Ala Leu Leu
370 375 380
Leu Arg Ala Gly Gly Pro Gly Asp Ala Arg Glu Thr Leu Leu Arg Thr
385 390 395 400
Thr Ala Met Cys Thr Ala Glu Arg Ala Ala Ala Ala Ala Glu Leu Thr
405 410 415
Arg Ala Ala Leu Ser Pro Thr Ala Ala Trp Asn Glu Pro Phe Ser Leu
420 425 430
Leu Asp Val Leu Ser Pro Cys Ala Val Ser Leu Arg Arg Asp Leu Gly
435 440 445
Gly Asp Ala Thr Leu Ala Asn Leu Gly Ala Ala Ala Arg Leu Ala Leu
450 455 460
Ala Pro Ala Gly Ala Pro Gly Ala Ala Ala Ala Thr Asp Glu Gly Ala
465 470 475 480
Glu Glu Glu Glu Glu Asp Pro Val Ala Arg Ala Ala Pro Glu Ile Pro
485 490 495
Ala Glu Ala Leu Leu Ala Leu Pro Leu Arg Gly Gly Ala Ser Phe Val
500 505 510
Phe Thr Arg Arg Arg Pro Asp Cys Gly Pro Ala Tyr Thr Leu Gly Gly
515 520 525
Val Asp Ile Ala Asn Pro Leu Val Leu Ala Ile Val Ser Asn Asp Ser
530 535 540
Ala Ala Cys Asp Tyr Thr Asp Arg Met Pro Glu Ser Gln His Leu Pro
545 550 555 560
Ala Thr Asp Asn Pro Ser Val Cys Val Tyr Cys Asp Cys Val Phe Val
565 570 575
Arg Tyr Ser Ser Ala Gly Thr Ile Leu Glu Thr Val Leu Ile Glu Ser
580 585 590
Lys Asp Met Glu Glu Gln Leu Met Ala Gly Ala Asn Ser Thr Ile Pro
595 600 605
Ser Phe Asn Pro Thr Leu His Gly Gly Asp Val Lys Ala Leu Met Leu
610 615 620
Phe Pro Asn Gly Thr Val Val Asp Leu Leu Ser Phe Thr Ser Thr Arg
625 630 635 640
Leu Ala Pro Val Ser Pro Ala Tyr Val Val Ala Ser Val Val Gly Ala
645 650 655
Ala Ile Thr Val Gly Ile Leu Tyr Ala Leu Phe Lys Met Leu Cys Ser
660 665 670
Phe Ser Ser Glu Gly Tyr Ser Arg Leu Ile Asn Ala Arg Ser
675 680 685
<210> 465
<211> 471
<212> DNA
<213> Varicellovirus Pseudorabies virus
<400> 465
atgagcccac tggtagccgt acttgttttc ttctctgccg ctcttggcat acccggtcct 60
ggagtggccg gtaatccaag gggccttgac gcgatatttg aagctcccgt gactccggcc 120
ccaccaaccc gacacccaag aagagaagaa ctcgaatggg atgacgaaga ccatcccctg 180
cttgatctgg aacccccagt cggttctaga tgtcaccctt atattgccta tagtttgccc 240
ccagatatga atgcggtgac ctctgtcgtg gtcaaaccgt attgtagccc acccgaagtg 300
atattgtggg cctcaggaac tgcatatctc gttaatccgt tcgttgcgat tcaagctttg 360
gctgtgggag aaccactgaa cgaagctgcg ttgaaagaac ttggcgaagt cgcagtccat 420
aaagattcat tgccaccctt gcgttacaac ggtggaccac cggctgaatg a 471
<210> 466
<211> 156
<212> PRT
<213> Varicellovirus Pseudorabies virus
<400> 466
Met Ser Pro Leu Val Ala Val Leu Val Phe Phe Ser Ala Ala Leu Gly
1 5 10 15
Ile Pro Gly Pro Gly Val Ala Gly Asn Pro Arg Gly Leu Asp Ala Ile
20 25 30
Phe Glu Ala Pro Val Thr Pro Ala Pro Pro Thr Arg His Pro Arg Arg
35 40 45
Glu Glu Leu Glu Trp Asp Asp Glu Asp His Pro Leu Leu Asp Leu Glu
50 55 60
Pro Pro Val Gly Ser Arg Cys His Pro Tyr Ile Ala Tyr Ser Leu Pro
65 70 75 80
Pro Asp Met Asn Ala Val Thr Ser Val Val Val Lys Pro Tyr Cys Ser
85 90 95
Pro Pro Glu Val Ile Leu Trp Ala Ser Gly Thr Ala Tyr Leu Val Asn
100 105 110
Pro Phe Val Ala Ile Gln Ala Leu Ala Val Gly Glu Pro Leu Asn Glu
115 120 125
Ala Ala Leu Lys Glu Leu Gly Glu Val Ala Val His Lys Asp Ser Leu
130 135 140
Pro Pro Leu Arg Tyr Asn Gly Gly Pro Pro Ala Glu
145 150 155
<210> 467
<211> 2715
<212> DNA
<213> Simplexvirus Herpes simplex virus 1
<400> 467
atgaggcaag gtgcacctgc caggggtcgg agatggtttg ttgtatgggc tctgctggga 60
ctgactttgg gcgtgctcgt tgcttccgca gcaccctctt ctccaggaac acctggcgtg 120
gctgcagcca cgcaagctgc taatggcggg ccagctaccc cagccccacc ggcaccagga 180
gctccaccta ctggcgatcc caagccaaag aagaataaga agccaaagcc acctaaaccc 240
cctcgaccag ctggtgataa tgctacagtg gctgcaggtc atgctacact cagagaacat 300
cttagagata taaaagctga aaatacagac gctaatttct atgtctgtcc cccacctaca 360
ggtgcaaccg ttgtccaatt tgaacaaccc aggagatgtc ctacacgtcc agaagggcag 420
aattataccg aaggtatagc cgttgtgttt aaagaaaata ttgcaccata taaatttaaa 480
gcgacgatgt attataagga tgtgacagtc agccaagtat ggtttgggca tcgatatagc 540
caattcatgg gcattttcga agatagagca cctgtaccgt ttgaagaagt tatagataaa 600
ataaatgcaa aaggcgtgtg ccgtagcaca gcgaaatatg ttcggaataa tttggaaaca 660
acggcattcc atcgcgatga tcatgaaaca gatatggaac ttaagcccgc aaatgctgcc 720
acacgtacct ctcgtgggtg gcatactaca gatctgaaat ataatccatc acgagtcgaa 780
gcatttcatc gatatggaac aaccgtgaat tgtattgtgg aagaagttga tgccagaagt 840
gtttatcctt atgatgaatt cgtcctcgca acaggagatt tcgtttatat gtcaccattc 900
tatggatatc gtgaaggtag tcatacagag catacttctt atgcagcaga taggtttaaa 960
caagtggatg gtttctatgc tcgggatttg actacaaaag caagagctac agcccccaca 1020
actcgaaatc ttctgaccac tcctaaattt actgtagcgt gggattgggt acccaaacga 1080
ccatccgtat gtactatgac aaaatggcaa gaagtagatg aaatgcttcg gtctgaatat 1140
ggtggaagct ttagattttc aagtgatgca atctctacta catttacaac taatctcaca 1200
gaatatcccc tttcacgagt cgatttggga gattgtattg gtaaagatgc gcgggatgca 1260
atggatcgga tatttgctcg tagatataat gccacacata taaaagttgg acaaccacaa 1320
tattatctcg caaacggcgg gttcctcatt gcctatcaac cgctcctttc taatactctt 1380
gccgaactct atgtccgaga gcatctgagg gaacaatcac gtaaaccgcc gaatccaaca 1440
cctcctccgc ctggagcatc cgcgaatgcc tctgtcgaac gtataaagac aacgtcttca 1500
attgaatttg ctagacttca attcacctat aatcatatcc aaaggcacgt taatgacatg 1560
ctgggtagag tcgcaattgc ttggtgtgaa ttgcaaaacc atgaacttac gttgtggaat 1620
gaagcacgta aattgaatcc aaatgcaatt gctagcgcga cggttggacg cagagtttcc 1680
gcccgaatgc tgggagatgt tatggcagtt tctacatgtg tccccgtggc tgccgataat 1740
gtcatagtgc agaattcaat gagaatatct agccgacctg gtgcatgtta ttctagacca 1800
ctcgtgagtt tccgctatga ggatcaaggg cccctggttg aaggccaact cggagaaaat 1860
aatgaattgc gcttgacaag ggacgcaatt gaaccatgta cagttggcca tcgccggtat 1920
tttacatttg gcggcgggta tgtctacttt gaggaatatg cctatagtca tcaactttct 1980
cgtgctgata ttacaactgt gtcaacattt attgatctga atattacgat gcttgaagac 2040
cacgaattcg taccgttgga agtctataca cgccatgaga taaaagattc cgggcttttg 2100
gattataccg aagtgcaacg acggaatcaa ctccatgatc tccgattcgc ggatattgat 2160
accgtaattc atgctgatgc aaatgctgct atgtttgctg gacttggggc attctttgaa 2220
ggaatgggcg atctcggaag agcagttggg aaagtcgtta tgggaatagt tggtggtgtc 2280
gttagtgcgg tttcaggtgt cagcagcttt atgagcaatc cattcggcgc cctcgcagtt 2340
gggctcctgg tgcttgctgg gcttgctgct gctttctttg ctttccggta tgtgatgagg 2400
cttcaatcca atccaatgaa agcactttat cccttgacta ctaaagaact gaagaatccg 2460
actaatcctg atgcttcagg agaaggggaa gaaggcgggg atttcgatga agctaaactg 2520
gcggaagcac gtgaaatgat ccgttatatg gcattggtca gcgctatgga aagaaccgag 2580
cataaagcta agaagaaagg aacttctgcc cttctctctg ctaaagttac tgatatggtg 2640
atgagaaaac ggcgtaatac aaattatact caggtaccga ataaggatgg cgatgcagat 2700
gaagatgatt tgtaa 2715
<210> 468
<211> 904
<212> PRT
<213> Simplexvirus Herpes simplex virus 1
<400> 468
Met Arg Gln Gly Ala Pro Ala Arg Gly Arg Arg Trp Phe Val Val Trp
1 5 10 15
Ala Leu Leu Gly Leu Thr Leu Gly Val Leu Val Ala Ser Ala Ala Pro
20 25 30
Ser Ser Pro Gly Thr Pro Gly Val Ala Ala Ala Thr Gln Ala Ala Asn
35 40 45
Gly Gly Pro Ala Thr Pro Ala Pro Pro Ala Pro Gly Ala Pro Pro Thr
50 55 60
Gly Asp Pro Lys Pro Lys Lys Asn Lys Lys Pro Lys Pro Pro Lys Pro
65 70 75 80
Pro Arg Pro Ala Gly Asp Asn Ala Thr Val Ala Ala Gly His Ala Thr
85 90 95
Leu Arg Glu His Leu Arg Asp Ile Lys Ala Glu Asn Thr Asp Ala Asn
100 105 110
Phe Tyr Val Cys Pro Pro Pro Thr Gly Ala Thr Val Val Gln Phe Glu
115 120 125
Gln Pro Arg Arg Cys Pro Thr Arg Pro Glu Gly Gln Asn Tyr Thr Glu
130 135 140
Gly Ile Ala Val Val Phe Lys Glu Asn Ile Ala Pro Tyr Lys Phe Lys
145 150 155 160
Ala Thr Met Tyr Tyr Lys Asp Val Thr Val Ser Gln Val Trp Phe Gly
165 170 175
His Arg Tyr Ser Gln Phe Met Gly Ile Phe Glu Asp Arg Ala Pro Val
180 185 190
Pro Phe Glu Glu Val Ile Asp Lys Ile Asn Ala Lys Gly Val Cys Arg
195 200 205
Ser Thr Ala Lys Tyr Val Arg Asn Asn Leu Glu Thr Thr Ala Phe His
210 215 220
Arg Asp Asp His Glu Thr Asp Met Glu Leu Lys Pro Ala Asn Ala Ala
225 230 235 240
Thr Arg Thr Ser Arg Gly Trp His Thr Thr Asp Leu Lys Tyr Asn Pro
245 250 255
Ser Arg Val Glu Ala Phe His Arg Tyr Gly Thr Thr Val Asn Cys Ile
260 265 270
Val Glu Glu Val Asp Ala Arg Ser Val Tyr Pro Tyr Asp Glu Phe Val
275 280 285
Leu Ala Thr Gly Asp Phe Val Tyr Met Ser Pro Phe Tyr Gly Tyr Arg
290 295 300
Glu Gly Ser His Thr Glu His Thr Ser Tyr Ala Ala Asp Arg Phe Lys
305 310 315 320
Gln Val Asp Gly Phe Tyr Ala Arg Asp Leu Thr Thr Lys Ala Arg Ala
325 330 335
Thr Ala Pro Thr Thr Arg Asn Leu Leu Thr Thr Pro Lys Phe Thr Val
340 345 350
Ala Trp Asp Trp Val Pro Lys Arg Pro Ser Val Cys Thr Met Thr Lys
355 360 365
Trp Gln Glu Val Asp Glu Met Leu Arg Ser Glu Tyr Gly Gly Ser Phe
370 375 380
Arg Phe Ser Ser Asp Ala Ile Ser Thr Thr Phe Thr Thr Asn Leu Thr
385 390 395 400
Glu Tyr Pro Leu Ser Arg Val Asp Leu Gly Asp Cys Ile Gly Lys Asp
405 410 415
Ala Arg Asp Ala Met Asp Arg Ile Phe Ala Arg Arg Tyr Asn Ala Thr
420 425 430
His Ile Lys Val Gly Gln Pro Gln Tyr Tyr Leu Ala Asn Gly Gly Phe
435 440 445
Leu Ile Ala Tyr Gln Pro Leu Leu Ser Asn Thr Leu Ala Glu Leu Tyr
450 455 460
Val Arg Glu His Leu Arg Glu Gln Ser Arg Lys Pro Pro Asn Pro Thr
465 470 475 480
Pro Pro Pro Pro Gly Ala Ser Ala Asn Ala Ser Val Glu Arg Ile Lys
485 490 495
Thr Thr Ser Ser Ile Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asn His
500 505 510
Ile Gln Arg His Val Asn Asp Met Leu Gly Arg Val Ala Ile Ala Trp
515 520 525
Cys Glu Leu Gln Asn His Glu Leu Thr Leu Trp Asn Glu Ala Arg Lys
530 535 540
Leu Asn Pro Asn Ala Ile Ala Ser Ala Thr Val Gly Arg Arg Val Ser
545 550 555 560
Ala Arg Met Leu Gly Asp Val Met Ala Val Ser Thr Cys Val Pro Val
565 570 575
Ala Ala Asp Asn Val Ile Val Gln Asn Ser Met Arg Ile Ser Ser Arg
580 585 590
Pro Gly Ala Cys Tyr Ser Arg Pro Leu Val Ser Phe Arg Tyr Glu Asp
595 600 605
Gln Gly Pro Leu Val Glu Gly Gln Leu Gly Glu Asn Asn Glu Leu Arg
610 615 620
Leu Thr Arg Asp Ala Ile Glu Pro Cys Thr Val Gly His Arg Arg Tyr
625 630 635 640
Phe Thr Phe Gly Gly Gly Tyr Val Tyr Phe Glu Glu Tyr Ala Tyr Ser
645 650 655
His Gln Leu Ser Arg Ala Asp Ile Thr Thr Val Ser Thr Phe Ile Asp
660 665 670
Leu Asn Ile Thr Met Leu Glu Asp His Glu Phe Val Pro Leu Glu Val
675 680 685
Tyr Thr Arg His Glu Ile Lys Asp Ser Gly Leu Leu Asp Tyr Thr Glu
690 695 700
Val Gln Arg Arg Asn Gln Leu His Asp Leu Arg Phe Ala Asp Ile Asp
705 710 715 720
Thr Val Ile His Ala Asp Ala Asn Ala Ala Met Phe Ala Gly Leu Gly
725 730 735
Ala Phe Phe Glu Gly Met Gly Asp Leu Gly Arg Ala Val Gly Lys Val
740 745 750
Val Met Gly Ile Val Gly Gly Val Val Ser Ala Val Ser Gly Val Ser
755 760 765
Ser Phe Met Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val
770 775 780
Leu Ala Gly Leu Ala Ala Ala Phe Phe Ala Phe Arg Tyr Val Met Arg
785 790 795 800
Leu Gln Ser Asn Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Glu
805 810 815
Leu Lys Asn Pro Thr Asn Pro Asp Ala Ser Gly Glu Gly Glu Glu Gly
820 825 830
Gly Asp Phe Asp Glu Ala Lys Leu Ala Glu Ala Arg Glu Met Ile Arg
835 840 845
Tyr Met Ala Leu Val Ser Ala Met Glu Arg Thr Glu His Lys Ala Lys
850 855 860
Lys Lys Gly Thr Ser Ala Leu Leu Ser Ala Lys Val Thr Asp Met Val
865 870 875 880
Met Arg Lys Arg Arg Asn Thr Asn Tyr Thr Gln Val Pro Asn Lys Asp
885 890 895
Gly Asp Ala Asp Glu Asp Asp Leu
900
<210> 469
<211> 1185
<212> DNA
<213> Simplexvirus Herpes simplex virus 1
<400> 469
atgggggggg ctgccgccag gttgggggcc gtgattttgt ttgtcgtcat agtgggcctc 60
catggggtcc gcagcaaata tgccttggtg gatgcctctc tcaagatggc cgaccccaat 120
cgctttcgcg gcaaagacct tccggtcctg gaccagctga ccgaccctcc gggggtccgg 180
cgcgtgtacc acatccaggc gggcctaccg gacccgttcc agccccccag cctcccgatc 240
acggtttact acgccgtgtt ggagcgcgcc tgccgcagcg tgctcctaaa cgcaccgtcg 300
gaggcccccc agattgtccg cggggcctcc gaagacgtcc ggaaacaacc ctacaacctg 360
accatcgctt ggtttcggat gggaggcaac tgtgctatcc ccatcacggt catggagtac 420
accgaatgct cctacaacaa gtctctgggg gcctgtccca tccgaacgca gccccgctgg 480
aactactatg acagcttcag cgccgtcagc gaggataacc tggggttcct gatgcacgcc 540
cccgcgtttg agaccgccgg cacgtacctg cggctcgtga agataaacga ctggacggag 600
attacacagt ttatcctgga gcaccgagcc aagggctcct gtaagtacgc cctcccgctg 660
cgcatccccc cgtcagcctg cctctccccc caggcctacc agcagggggt gacggtggac 720
agcatcggga tgctgccccg cttcatcccc gagaaccagc gcaccgtcgc cgtatacagc 780
ttgaagatcg ccgggtggca cgggcccaag gccccataca cgagcaccct gctgcccccg 840
gagctgtccg agacccccaa cgccacgcag ccagaactcg ccccggaaga ccccgaggat 900
tcggccctct tggaggaccc cgtggggacg gtggcgccgc aaatcccacc aaactggcac 960
ataccgtcga tccaggacgc cgcgacgcct taccatcccc cggccacccc gaacaacatg 1020
ggcctgatcg ccggcgcggt gggcggcagt ctcctggcag ccctggtcat ttgcggaatt 1080
gtgtactgga tgcgccgcca cactcaaaaa gccccaaagc gcatacgcct cccccacatc 1140
cgggaagacg accagccgtc ctcgcaccag cccttgtttt actag 1185
<210> 470
<211> 394
<212> PRT
<213> Simplexvirus Herpes simplex virus 1
<400> 470
Met Gly Gly Ala Ala Ala Arg Leu Gly Ala Val Ile Leu Phe Val Val
1 5 10 15
Ile Val Gly Leu His Gly Val Arg Ser Lys Tyr Ala Leu Val Asp Ala
20 25 30
Ser Leu Lys Met Ala Asp Pro Asn Arg Phe Arg Gly Lys Asp Leu Pro
35 40 45
Val Leu Asp Gln Leu Thr Asp Pro Pro Gly Val Arg Arg Val Tyr His
50 55 60
Ile Gln Ala Gly Leu Pro Asp Pro Phe Gln Pro Pro Ser Leu Pro Ile
65 70 75 80
Thr Val Tyr Tyr Ala Val Leu Glu Arg Ala Cys Arg Ser Val Leu Leu
85 90 95
Asn Ala Pro Ser Glu Ala Pro Gln Ile Val Arg Gly Ala Ser Glu Asp
100 105 110
Val Arg Lys Gln Pro Tyr Asn Leu Thr Ile Ala Trp Phe Arg Met Gly
115 120 125
Gly Asn Cys Ala Ile Pro Ile Thr Val Met Glu Tyr Thr Glu Cys Ser
130 135 140
Tyr Asn Lys Ser Leu Gly Ala Cys Pro Ile Arg Thr Gln Pro Arg Trp
145 150 155 160
Asn Tyr Tyr Asp Ser Phe Ser Ala Val Ser Glu Asp Asn Leu Gly Phe
165 170 175
Leu Met His Ala Pro Ala Phe Glu Thr Ala Gly Thr Tyr Leu Arg Leu
180 185 190
Val Lys Ile Asn Asp Trp Thr Glu Ile Thr Gln Phe Ile Leu Glu His
195 200 205
Arg Ala Lys Gly Ser Cys Lys Tyr Ala Leu Pro Leu Arg Ile Pro Pro
210 215 220
Ser Ala Cys Leu Ser Pro Gln Ala Tyr Gln Gln Gly Val Thr Val Asp
225 230 235 240
Ser Ile Gly Met Leu Pro Arg Phe Ile Pro Glu Asn Gln Arg Thr Val
245 250 255
Ala Val Tyr Ser Leu Lys Ile Ala Gly Trp His Gly Pro Lys Ala Pro
260 265 270
Tyr Thr Ser Thr Leu Leu Pro Pro Glu Leu Ser Glu Thr Pro Asn Ala
275 280 285
Thr Gln Pro Glu Leu Ala Pro Glu Asp Pro Glu Asp Ser Ala Leu Leu
290 295 300
Glu Asp Pro Val Gly Thr Val Ala Pro Gln Ile Pro Pro Asn Trp His
305 310 315 320
Ile Pro Ser Ile Gln Asp Ala Ala Thr Pro Tyr His Pro Pro Ala Thr
325 330 335
Pro Asn Asn Met Gly Leu Ile Ala Gly Ala Val Gly Gly Ser Leu Leu
340 345 350
Ala Ala Leu Val Ile Cys Gly Ile Val Tyr Trp Met Arg Arg His Thr
355 360 365
Gln Lys Ala Pro Lys Arg Ile Arg Leu Pro His Ile Arg Glu Asp Asp
370 375 380
Gln Pro Ser Ser His Gln Pro Leu Phe Tyr
385 390
<210> 471
<211> 2517
<212> DNA
<213> Simplexvirus Herpes simplex virus 1
<400> 471
atgggaaacg gcttgtggtt tgttggtgtg ataatcctgg gagtagcctg gggccaagta 60
catgattgga cagaacaaac cgatccttgg ttcctggacg gacttgggat ggatcggatg 120
tattggcgag atacaaatac tggaagactc tggcttccta atacaccaga tcctcagaag 180
ccacccaggg gcttccttgc tccaccagat gagctcaatc ttacaacagc tagtctcccg 240
ctgctgagat ggtatgaaga acggttctgc ttcgtgctgg taacaaccgc tgaattccct 300
cgcgatccag gacaattgtt gtatattccc aaaacatatc ttctgggtcg accacccaat 360
gcctctctcc cagcacctac tacagtggaa ccaacagctc aacccccgcc gtccgtggct 420
cctctgaaag ggcttctgca taaccccgta gcatcagtct tgctccgcag tcgtgcgtgg 480
gtcacattca gcgctgtgcc cgatcctgaa gcactcactt ttcccagggg cgataatgtc 540
gccacagcat ctcatccttc tggaccacgc gacactccac cccctcgccc acctgtcggc 600
gctcgcaggc atcccacaac agaacttgat attactcatc ttcataatgc ctcaactaca 660
tggctggcta caagagggct tctgcggagc cccgggagat atgtctactt ttctccctct 720
gcttctacat ggccagttgg aatatggaca actggtgaac ttgtccttgg ttgtgacgca 780
gcacttgtca gggcccggta tggtcgcgag tttatgggac tggtcatctc aatgcatgat 840
tcaccgccag tcgaggtcat ggttgtgccg gccggtcaaa cactggaccg agtgggagat 900
cctgcagatg aaaatccacc tggcgccctg ccaggcccac ccggtggacc aaggtaccgc 960
gtgttcgtgc tcggttcact cacccgtgca gataatggta gcgccttgga tgcactgaga 1020
cgtgtcggtg ggtatcctga agaagggacc aattatgcac aatttctcag tagggcgtat 1080
gctgaattct ttagcggaga tgctggagct gaacaagggc cacggccacc cttgttttgg 1140
cggctcactg gactcctggc cacctctgga ttcgcatttg tcaatgctgc tcatgccaat 1200
ggggctgtat gtctgtctga tctcttgggg ttccttgctc atagtcgagc cctcgcaggc 1260
ctggctgctc ggggagctgc cggttgcgca gccgacagtg tcttcttcaa cgtttccgtg 1320
cttgacccga ctgcaagact tcaactggaa gcaagattgc aacatctcgt tgcagaaatc 1380
ttggaaaggg agcaatccct ggctctgcat gcactcggat accaactcgc atttgtactt 1440
gactcccctt ccgcctatga tgccgttgca ccttctgccg ctcacctgat tgatgcattg 1500
tacgcagaat tcctcggcgg aagggttctt actactccag tggtgcatag ggccttgttc 1560
tatgcttctg cggtattgag acaaccattt ctggccggag tgcctagcgc cgtccaaagg 1620
gagcgagcta ggagatcact cctgattgcc tctgcactct gcacatctga tgtagcagcc 1680
gccacaaatg ctgatctgag gactgccctc gctagagctg atcatcaaaa gacgcttttc 1740
tggctccccg atcatttcag tccttgtgca gcgtcactta gattcgacct tgatgaatca 1800
gtcttcatat tggatgcact cgcccaggca actagatctg aaacacctgt tgaggtgctc 1860
gctcaacaaa cacatggttt ggcttctaca ctcacaaggt gggcccatta taatgcattg 1920
attcgggctt ttgtgcccga agcgtcccac cgatgtggcg gacaatcagc aaatgtggaa 1980
cccaggatat tggtgcctat tacgcataat gcttcttatg tggttacgca tagcccattg 2040
ccacgcggca ttgggtataa actgacgggt gtggatgttc gcagacctct gtttctgact 2100
tatctgacag caacctgtga gggttctact cgcgacattg aaagcaaacg tctcgtaagg 2160
acgcagaatc aaagagattt gggtctggtt ggcgctgttt tcatgaggta tactcccgca 2220
ggcgaagtta tgagcgtcct gctcgtcgac accgataata cccaacaaca gattgcagcg 2280
ggccccacag aaggggctcc atcagtcttc tccagcgatg ttccttcaac cgcgctgctc 2340
ctgttcccga atggcacggt tatccacctg ttggcgttcg atacacaacc tgtcgcagcc 2400
atcgcaccgg gattcttggc tgcatccgcc ctcggggttg tgatgataac agcagctctc 2460
gcggggatac tgaaagtgct gcgcaccagc gtgcccttct tctggcgacg agagtga 2517
<210> 472
<211> 838
<212> PRT
<213> Simplexvirus Herpes simplex virus 1
<400> 472
Met Gly Asn Gly Leu Trp Phe Val Gly Val Ile Ile Leu Gly Val Ala
1 5 10 15
Trp Gly Gln Val His Asp Trp Thr Glu Gln Thr Asp Pro Trp Phe Leu
20 25 30
Asp Gly Leu Gly Met Asp Arg Met Tyr Trp Arg Asp Thr Asn Thr Gly
35 40 45
Arg Leu Trp Leu Pro Asn Thr Pro Asp Pro Gln Lys Pro Pro Arg Gly
50 55 60
Phe Leu Ala Pro Pro Asp Glu Leu Asn Leu Thr Thr Ala Ser Leu Pro
65 70 75 80
Leu Leu Arg Trp Tyr Glu Glu Arg Phe Cys Phe Val Leu Val Thr Thr
85 90 95
Ala Glu Phe Pro Arg Asp Pro Gly Gln Leu Leu Tyr Ile Pro Lys Thr
100 105 110
Tyr Leu Leu Gly Arg Pro Pro Asn Ala Ser Leu Pro Ala Pro Thr Thr
115 120 125
Val Glu Pro Thr Ala Gln Pro Pro Pro Ser Val Ala Pro Leu Lys Gly
130 135 140
Leu Leu His Asn Pro Val Ala Ser Val Leu Leu Arg Ser Arg Ala Trp
145 150 155 160
Val Thr Phe Ser Ala Val Pro Asp Pro Glu Ala Leu Thr Phe Pro Arg
165 170 175
Gly Asp Asn Val Ala Thr Ala Ser His Pro Ser Gly Pro Arg Asp Thr
180 185 190
Pro Pro Pro Arg Pro Pro Val Gly Ala Arg Arg His Pro Thr Thr Glu
195 200 205
Leu Asp Ile Thr His Leu His Asn Ala Ser Thr Thr Trp Leu Ala Thr
210 215 220
Arg Gly Leu Leu Arg Ser Pro Gly Arg Tyr Val Tyr Phe Ser Pro Ser
225 230 235 240
Ala Ser Thr Trp Pro Val Gly Ile Trp Thr Thr Gly Glu Leu Val Leu
245 250 255
Gly Cys Asp Ala Ala Leu Val Arg Ala Arg Tyr Gly Arg Glu Phe Met
260 265 270
Gly Leu Val Ile Ser Met His Asp Ser Pro Pro Val Glu Val Met Val
275 280 285
Val Pro Ala Gly Gln Thr Leu Asp Arg Val Gly Asp Pro Ala Asp Glu
290 295 300
Asn Pro Pro Gly Ala Leu Pro Gly Pro Pro Gly Gly Pro Arg Tyr Arg
305 310 315 320
Val Phe Val Leu Gly Ser Leu Thr Arg Ala Asp Asn Gly Ser Ala Leu
325 330 335
Asp Ala Leu Arg Arg Val Gly Gly Tyr Pro Glu Glu Gly Thr Asn Tyr
340 345 350
Ala Gln Phe Leu Ser Arg Ala Tyr Ala Glu Phe Phe Ser Gly Asp Ala
355 360 365
Gly Ala Glu Gln Gly Pro Arg Pro Pro Leu Phe Trp Arg Leu Thr Gly
370 375 380
Leu Leu Ala Thr Ser Gly Phe Ala Phe Val Asn Ala Ala His Ala Asn
385 390 395 400
Gly Ala Val Cys Leu Ser Asp Leu Leu Gly Phe Leu Ala His Ser Arg
405 410 415
Ala Leu Ala Gly Leu Ala Ala Arg Gly Ala Ala Gly Cys Ala Ala Asp
420 425 430
Ser Val Phe Phe Asn Val Ser Val Leu Asp Pro Thr Ala Arg Leu Gln
435 440 445
Leu Glu Ala Arg Leu Gln His Leu Val Ala Glu Ile Leu Glu Arg Glu
450 455 460
Gln Ser Leu Ala Leu His Ala Leu Gly Tyr Gln Leu Ala Phe Val Leu
465 470 475 480
Asp Ser Pro Ser Ala Tyr Asp Ala Val Ala Pro Ser Ala Ala His Leu
485 490 495
Ile Asp Ala Leu Tyr Ala Glu Phe Leu Gly Gly Arg Val Leu Thr Thr
500 505 510
Pro Val Val His Arg Ala Leu Phe Tyr Ala Ser Ala Val Leu Arg Gln
515 520 525
Pro Phe Leu Ala Gly Val Pro Ser Ala Val Gln Arg Glu Arg Ala Arg
530 535 540
Arg Ser Leu Leu Ile Ala Ser Ala Leu Cys Thr Ser Asp Val Ala Ala
545 550 555 560
Ala Thr Asn Ala Asp Leu Arg Thr Ala Leu Ala Arg Ala Asp His Gln
565 570 575
Lys Thr Leu Phe Trp Leu Pro Asp His Phe Ser Pro Cys Ala Ala Ser
580 585 590
Leu Arg Phe Asp Leu Asp Glu Ser Val Phe Ile Leu Asp Ala Leu Ala
595 600 605
Gln Ala Thr Arg Ser Glu Thr Pro Val Glu Val Leu Ala Gln Gln Thr
610 615 620
His Gly Leu Ala Ser Thr Leu Thr Arg Trp Ala His Tyr Asn Ala Leu
625 630 635 640
Ile Arg Ala Phe Val Pro Glu Ala Ser His Arg Cys Gly Gly Gln Ser
645 650 655
Ala Asn Val Glu Pro Arg Ile Leu Val Pro Ile Thr His Asn Ala Ser
660 665 670
Tyr Val Val Thr His Ser Pro Leu Pro Arg Gly Ile Gly Tyr Lys Leu
675 680 685
Thr Gly Val Asp Val Arg Arg Pro Leu Phe Leu Thr Tyr Leu Thr Ala
690 695 700
Thr Cys Glu Gly Ser Thr Arg Asp Ile Glu Ser Lys Arg Leu Val Arg
705 710 715 720
Thr Gln Asn Gln Arg Asp Leu Gly Leu Val Gly Ala Val Phe Met Arg
725 730 735
Tyr Thr Pro Ala Gly Glu Val Met Ser Val Leu Leu Val Asp Thr Asp
740 745 750
Asn Thr Gln Gln Gln Ile Ala Ala Gly Pro Thr Glu Gly Ala Pro Ser
755 760 765
Val Phe Ser Ser Asp Val Pro Ser Thr Ala Leu Leu Leu Phe Pro Asn
770 775 780
Gly Thr Val Ile His Leu Leu Ala Phe Asp Thr Gln Pro Val Ala Ala
785 790 795 800
Ile Ala Pro Gly Phe Leu Ala Ala Ser Ala Leu Gly Val Val Met Ile
805 810 815
Thr Ala Ala Leu Ala Gly Ile Leu Lys Val Leu Arg Thr Ser Val Pro
820 825 830
Phe Phe Trp Arg Arg Glu
835
<210> 473
<211> 675
<212> DNA
<213> Simplexvirus Herpes simplex virus 1
<400> 473
atggggattt tgggttgggt cgggcttatt gccgttgggg ttttgtgtgt gcgggggggc 60
ttgccttcaa ccgaatatgt tattcggagt cgggtggctc gagaggtggg ggatatatta 120
aaggtgcctt gtgtgccgct cccgtctgac gatcttgatt ggcgttacga gaccccctcg 180
gctataaact atgctttgat agacggtata tttttgcgtt atcactgtcc cggattggac 240
acggtcttgt gggataggca tgcccagaag gcatattggg ttaacccctt tttatttgtg 300
gcgggttttt tggaggactt gagttacccc gcgtttcctg ccaacaccca ggaaacagaa 360
acgcgcttgg ccctttataa agagatacgc caggcgctgg acagtcgcaa gcaggccgcc 420
agccacacac ctgtgaaggc tgggtgtgtg aactttgact attcgcgcac ccgccgctgt 480
gtagggcgac aggatttggg acctaccaac ggaacgtctg gacggacccc ggttctgccg 540
ccggacgatg aagcgggcct gcagccgaag cccctcacca cgccgccgcc catcatcgcc 600
acgtcggacc ccaccccgcg acgggacgcc gccacaaaaa gcagacgccg acgaccccac 660
tcccggcgcc tctaa 675
<210> 474
<211> 224
<212> PRT
<213> Simplexvirus Herpes simplex virus 1
<400> 474
Met Gly Ile Leu Gly Trp Val Gly Leu Ile Ala Val Gly Val Leu Cys
1 5 10 15
Val Arg Gly Gly Leu Pro Ser Thr Glu Tyr Val Ile Arg Ser Arg Val
20 25 30
Ala Arg Glu Val Gly Asp Ile Leu Lys Val Pro Cys Val Pro Leu Pro
35 40 45
Ser Asp Asp Leu Asp Trp Arg Tyr Glu Thr Pro Ser Ala Ile Asn Tyr
50 55 60
Ala Leu Ile Asp Gly Ile Phe Leu Arg Tyr His Cys Pro Gly Leu Asp
65 70 75 80
Thr Val Leu Trp Asp Arg His Ala Gln Lys Ala Tyr Trp Val Asn Pro
85 90 95
Phe Leu Phe Val Ala Gly Phe Leu Glu Asp Leu Ser Tyr Pro Ala Phe
100 105 110
Pro Ala Asn Thr Gln Glu Thr Glu Thr Arg Leu Ala Leu Tyr Lys Glu
115 120 125
Ile Arg Gln Ala Leu Asp Ser Arg Lys Gln Ala Ala Ser His Thr Pro
130 135 140
Val Lys Ala Gly Cys Val Asn Phe Asp Tyr Ser Arg Thr Arg Arg Cys
145 150 155 160
Val Gly Arg Gln Asp Leu Gly Pro Thr Asn Gly Thr Ser Gly Arg Thr
165 170 175
Pro Val Leu Pro Pro Asp Asp Glu Ala Gly Leu Gln Pro Lys Pro Leu
180 185 190
Thr Thr Pro Pro Pro Ile Ile Ala Thr Ser Asp Pro Thr Pro Arg Arg
195 200 205
Asp Ala Ala Thr Lys Ser Arg Arg Arg Arg Pro His Ser Arg Arg Leu
210 215 220
<210> 475
<211> 1746
<212> DNA
<213> Hepacivirus Hepatitis C Virus
<400> 475
atgggttgct ctttttctat cttcttactt gcccttctgt cgtgccttac agtgccagcg 60
tctgcggtgg aagttaggaa cgtcagttct agctactatg ccaccaatga ttgctcgaac 120
agcagcatca cctggcaact caacaacgca gttctccacc ttcctggatg cgtcccatgt 180
gagaatgata acggcacctt gcactgctgg atacaagtaa caccaaatgt ggctgtgaaa 240
caccgcggcg cgctcactca taacctgcgg acgcacgtcg atatgatcgt aatggcagct 300
acggtctgtt cggccctgta tgtgggagac atgtgcgggg ccgtgatgat tgtgtcgcag 360
gctctcataa tatcgccaga acgccacaac ttcacccaag agtgcaactg ttccatctac 420
caaggtcata tcactggcca tcgcatggca tgggacatga tgctaaactg gtcaccaact 480
cttaccatga tccttgctta tgccgctcgt gttcccgagc tagtccttga agttgtcttt 540
ggtggtcatt ggggtgtggt atttggcttg gcctatttct ccatgcaggg agcgtgggcc 600
aaggtcattg ccatcctcct tcttgttgcg ggagtggacg cagagactca taccaccggc 660
tcagctgcgg gtcatgccgc aagggggttt gccaacctcc ttagtcctgg ttccaagcaa 720
aaaataagtt tgatcaatac caatggcagc tggcacataa accggaccgc ccttaattgt 780
aatgacagct tgcagacggg tttcctcgct tctttgtttt acgtcaacaa cttcaacagc 840
tctggctgcc ccgagcgcat gtcttcctgc cgtgggctgg acgatttccg catcgggtgg 900
ggaaccctgg aatacgagac caacgtcacc aacgaggagg acatgaggcc gtactgctgg 960
cattaccctc cgaagccttg cggcattatc tcggctagga cagtttgcgg gccggtctac 1020
tgtttcactc ctagccctgt tgttgtgggt actactgacg agcagggctt gcccacctat 1080
agctgggggg aaaatgagac cgatgtcttc ctgttaaata gcacaagacc cccgcaagga 1140
gcttggttcg gctgcacttg gatgaatggg actgggttta ctaagacatg cggtgcacca 1200
ccttgccgca ttaggaggga tttcaacagc accctcgatc tactgtgccc cacagactgc 1260
tttagaaagc acccggacac cacctatctc aagtgtggag cagggccttg gttaaccccc 1320
agatgcctgg tagactaccc ttatagattg tggcattatc cgtgcaccgt aaattttacc 1380
atctttaagg tgcggatgta tgtggggggg gtggagcatc gattgtcagc agcatgcaac 1440
ttcacgcgcg gggaccgctg cagattggag gacagagata ggggtcagca gagcccactg 1500
ctgcattcca ccactgagtg ggcggtatta ccatgctctt tctccgactt accggcactg 1560
tccactggtc tattgcacct ccatcaaaat atcgtggacg tgcagtatct ctatggactt 1620
actccggcta tcacaaaata catcgtgaag tgggagtggg tggttctcct ctttttgctg 1680
ttggcagacg ccagggtctg tgcgtgcctt tggatgctca tcatattggg ccaagccgaa 1740
gcgtaa 1746
<210> 476
<211> 581
<212> PRT
<213> Hepacivirus Hepatitis C Virus
<400> 476
Met Gly Cys Ser Phe Ser Ile Phe Leu Leu Ala Leu Leu Ser Cys Leu
1 5 10 15
Thr Val Pro Ala Ser Ala Val Glu Val Arg Asn Val Ser Ser Ser Tyr
20 25 30
Tyr Ala Thr Asn Asp Cys Ser Asn Ser Ser Ile Thr Trp Gln Leu Asn
35 40 45
Asn Ala Val Leu His Leu Pro Gly Cys Val Pro Cys Glu Asn Asp Asn
50 55 60
Gly Thr Leu His Cys Trp Ile Gln Val Thr Pro Asn Val Ala Val Lys
65 70 75 80
His Arg Gly Ala Leu Thr His Asn Leu Arg Thr His Val Asp Met Ile
85 90 95
Val Met Ala Ala Thr Val Cys Ser Ala Leu Tyr Val Gly Asp Met Cys
100 105 110
Gly Ala Val Met Ile Val Ser Gln Ala Leu Ile Ile Ser Pro Glu Arg
115 120 125
His Asn Phe Thr Gln Glu Cys Asn Cys Ser Ile Tyr Gln Gly His Ile
130 135 140
Thr Gly His Arg Met Ala Trp Asp Met Met Leu Asn Trp Ser Pro Thr
145 150 155 160
Leu Thr Met Ile Leu Ala Tyr Ala Ala Arg Val Pro Glu Leu Val Leu
165 170 175
Glu Val Val Phe Gly Gly His Trp Gly Val Val Phe Gly Leu Ala Tyr
180 185 190
Phe Ser Met Gln Gly Ala Trp Ala Lys Val Ile Ala Ile Leu Leu Leu
195 200 205
Val Ala Gly Val Asp Ala Glu Thr His Thr Thr Gly Ser Ala Ala Gly
210 215 220
His Ala Ala Arg Gly Phe Ala Asn Leu Leu Ser Pro Gly Ser Lys Gln
225 230 235 240
Lys Ile Ser Leu Ile Asn Thr Asn Gly Ser Trp His Ile Asn Arg Thr
245 250 255
Ala Leu Asn Cys Asn Asp Ser Leu Gln Thr Gly Phe Leu Ala Ser Leu
260 265 270
Phe Tyr Val Asn Asn Phe Asn Ser Ser Gly Cys Pro Glu Arg Met Ser
275 280 285
Ser Cys Arg Gly Leu Asp Asp Phe Arg Ile Gly Trp Gly Thr Leu Glu
290 295 300
Tyr Glu Thr Asn Val Thr Asn Glu Glu Asp Met Arg Pro Tyr Cys Trp
305 310 315 320
His Tyr Pro Pro Lys Pro Cys Gly Ile Ile Ser Ala Arg Thr Val Cys
325 330 335
Gly Pro Val Tyr Cys Phe Thr Pro Ser Pro Val Val Val Gly Thr Thr
340 345 350
Asp Glu Gln Gly Leu Pro Thr Tyr Ser Trp Gly Glu Asn Glu Thr Asp
355 360 365
Val Phe Leu Leu Asn Ser Thr Arg Pro Pro Gln Gly Ala Trp Phe Gly
370 375 380
Cys Thr Trp Met Asn Gly Thr Gly Phe Thr Lys Thr Cys Gly Ala Pro
385 390 395 400
Pro Cys Arg Ile Arg Arg Asp Phe Asn Ser Thr Leu Asp Leu Leu Cys
405 410 415
Pro Thr Asp Cys Phe Arg Lys His Pro Asp Thr Thr Tyr Leu Lys Cys
420 425 430
Gly Ala Gly Pro Trp Leu Thr Pro Arg Cys Leu Val Asp Tyr Pro Tyr
435 440 445
Arg Leu Trp His Tyr Pro Cys Thr Val Asn Phe Thr Ile Phe Lys Val
450 455 460
Arg Met Tyr Val Gly Gly Val Glu His Arg Leu Ser Ala Ala Cys Asn
465 470 475 480
Phe Thr Arg Gly Asp Arg Cys Arg Leu Glu Asp Arg Asp Arg Gly Gln
485 490 495
Gln Ser Pro Leu Leu His Ser Thr Thr Glu Trp Ala Val Leu Pro Cys
500 505 510
Ser Phe Ser Asp Leu Pro Ala Leu Ser Thr Gly Leu Leu His Leu His
515 520 525
Gln Asn Ile Val Asp Val Gln Tyr Leu Tyr Gly Leu Thr Pro Ala Ile
530 535 540
Thr Lys Tyr Ile Val Lys Trp Glu Trp Val Val Leu Leu Phe Leu Leu
545 550 555 560
Leu Ala Asp Ala Arg Val Cys Ala Cys Leu Trp Met Leu Ile Ile Leu
565 570 575
Gly Gln Ala Glu Ala
580
<210> 477
<211> 1575
<212> DNA
<213> Lyssavirus Rabies Virus
<400> 477
atggttcctc aggctctcct gtttgtaccc cttctggttt ttccattgtg ttttgggaaa 60
ttccctattt acacgatacc agacaagctt ggtccctgga gtccgattga catacatcac 120
ctcagctgcc caaacaattt ggtagtggag gacgaaggat gcaccaacct gtcagggttc 180
tcctacatgg aacttaaagt tggatacatc ttagccataa aagtgaacgg gttcacttgc 240
acaggcgttg tgacggaggc tgaaacctac actaacttcg ttggttatgt cacaaccacg 300
ttcaaaagaa agcatttccg cccaacacca gatgcatgta gagccgcgta caactggaag 360
atggccggtg accccagata tgaagagtct ctacacaatc cgtaccctga ctaccgctgg 420
cttcgaactg taaaaaccac caaggagtct ctcgttatca tatctccaag tgtggcagat 480
ttggacccat atgacagatc ccttcactcg agggtcttcc ctagcgggaa gtgctcagga 540
gtagcggtgt cttctaccta ctgctccact aaccacgatt acaccatttg gatgcccgag 600
aatccgagac tagggatgtc ttgtgacatt tttaccaata gtagagggaa gagagcatcc 660
aaagggagtg agacttgcgg ctttgtagat gaaagaggcc tatataagtc tttaaaagga 720
gcatgcaaac tcaagttatg tggagttcta ggacttagac ttatggatgg aacatgggtc 780
tcgatgcaaa catcaaatga aaccaaatgg tgccctcccg ataagttggt gaacctgcac 840
gactttcgct cagacgaaat tgagcacctt gttgtagagg agttggtcag gaagagagag 900
gagtgtctgg atgcactaga gtccatcatg acaaccaagt cagtgagttt cagacgtctc 960
agtcatttaa gaaaacttgt ccctgggttt ggaaaagcat ataccatatt caacaagacc 1020
ttgatggaag ccgatgctca ctacaagtca gtcagaactt ggaatgagat cctcccttca 1080
aaagggtgtt taagagttgg ggggaggtgt catcctcatg tgaacggggt gtttttcaat 1140
ggtataatat taggacctga cggcaatgtc ttaatcccag agatgcaatc atccctcctc 1200
cagcaacata tggagttgtt ggaatcctcg gttatccccc ttgtgcaccc cctggcagac 1260
ccgtctaccg ttttcaagga cggtgacgag gctgaggatt ttgttgaagt tcaccttccc 1320
gatgtgcaca atcaggtctc aggagttgac ttgggtctcc cgaactgggg gaagtatgta 1380
ttactgagtg caggggccct gactgccttg atgttgataa ttttcctgat gacatgttgt 1440
agaagagtca atcgatcaga acctacgcaa cacaatctca gagggacagg gagggaggtg 1500
tcagtcactc cccaaagcgg gaagatcata tcttcatggg aatcacacaa gagtgggggt 1560
gagaccagac tgtaa 1575
<210> 478
<211> 524
<212> PRT
<213> Lyssavirus Rabies Virus
<400> 478
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ser Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Lys Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr
485 490 495
Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser
500 505 510
Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 479
<211> 1569
<212> DNA
<213> Lyssavirus Mokola Virus
<400> 479
atgaatatac cttgctttgt tgtgattctc agcttagcca ctacacattc tctgggagaa 60
ttccccttgt acacaattcc tgagaagata gagaaatgga ctcccataga catgatccat 120
ctgagttgcc ccaacaacct attatctgag gaagaaggtt gcaatgcaga gtcatccttt 180
acttactttg agctcaagag tggttaccta gctcatcaga aggttccagg gtttacctgt 240
accggggtcg tgaacgaggc agagacatat acaaacttcg tcgggtacgt caccacaacc 300
ttcaaaagga agcactttag gcctacagta gccgcctgtc gtgatgccta caactggaaa 360
gtgtcaggag accccaggta cgaagagtca ctccacactc cttatcctga cagcagttgg 420
ttgaggactg tgactacaac caaagaatca cttctcataa tatcgcccag catcgtggaa 480
atggatattt acggcaggac tctccattcc cccatgtttc cttcaggagt atgttccaac 540
gtatatccct ctgtcccatc ctgtgagact aatcatgatt acacattatg gctgcctgaa 600
gatcctagtt tgagtttggt ctgtgatatc tttacttcca gcaacggaaa gaaggccatg 660
aacgggtcac gcatctgcgg attcaaggat gaaaggggat tctacagatc tttaaagggc 720
gcttgcaagc tgacattgtg tggaagacct ggaattaggt tattcgacgg aacttgggtc 780
tcttttacaa agccggacgt gcacgtatgg tgcactccca accaattgat caatatacac 840
aatgacagac tagatgagat agaacacctg atcgtggaag acatcataaa gaaaagagaa 900
gagtgcttag acaccctgga aacaatactt atgtctcaat ctgttagctt tagaaggttg 960
agccatttcc gaaagttagt tccaggatat gggaaggcct acactatttt aaacggcagc 1020
ctgatggaaa caaatgtcta ctacaaaagg gtcgacaagt gggctgacat cttaccctct 1080
aagggatgtc tgaaagtcgg gcaacaatgc atggaacctg tcaaaggagt cctcttcaat 1140
gggattatca agggcccgga tggccaaatt ttgatccccg agatgcagtc agagcagcta 1200
aagcagcata tggacctgtt gaaggcggct gtgtttcctc tccgacaccc tttaatcagc 1260
cgggaggcag tctttaagaa agacggggat gccgatgatt ttgtggatct ccatatgcct 1320
gatgtccaca agtctgtgtc agatgtcgac ctgggtctgc ctcattgggg tttctggatg 1380
ttgatcgggg caacaatagt agcatttgtg gtcttggtat gtttactccg tgtatgttgt 1440
aagagagtga ggaggagaag atcaggacgt gcaactcagg agatccccct gagctttccc 1500
tctgcccctg ttcctcgagc caaagtggtg tcatcttggg agtcctataa agggcttcca 1560
ggtacatga 1569
<210> 480
<211> 522
<212> PRT
<213> Lyssavirus Mokola Virus
<400> 480
Met Asn Ile Pro Cys Phe Val Val Ile Leu Ser Leu Ala Thr Thr His
1 5 10 15
Ser Leu Gly Glu Phe Pro Leu Tyr Thr Ile Pro Glu Lys Ile Glu Lys
20 25 30
Trp Thr Pro Ile Asp Met Ile His Leu Ser Cys Pro Asn Asn Leu Leu
35 40 45
Ser Glu Glu Glu Gly Cys Asn Ala Glu Ser Ser Phe Thr Tyr Phe Glu
50 55 60
Leu Lys Ser Gly Tyr Leu Ala His Gln Lys Val Pro Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Asn Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Val Ala Ala
100 105 110
Cys Arg Asp Ala Tyr Asn Trp Lys Val Ser Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Thr Pro Tyr Pro Asp Ser Ser Trp Leu Arg Thr Val
130 135 140
Thr Thr Thr Lys Glu Ser Leu Leu Ile Ile Ser Pro Ser Ile Val Glu
145 150 155 160
Met Asp Ile Tyr Gly Arg Thr Leu His Ser Pro Met Phe Pro Ser Gly
165 170 175
Val Cys Ser Asn Val Tyr Pro Ser Val Pro Ser Cys Glu Thr Asn His
180 185 190
Asp Tyr Thr Leu Trp Leu Pro Glu Asp Pro Ser Leu Ser Leu Val Cys
195 200 205
Asp Ile Phe Thr Ser Ser Asn Gly Lys Lys Ala Met Asn Gly Ser Arg
210 215 220
Ile Cys Gly Phe Lys Asp Glu Arg Gly Phe Tyr Arg Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Thr Leu Cys Gly Arg Pro Gly Ile Arg Leu Phe Asp
245 250 255
Gly Thr Trp Val Ser Phe Thr Lys Pro Asp Val His Val Trp Cys Thr
260 265 270
Pro Asn Gln Leu Ile Asn Ile His Asn Asp Arg Leu Asp Glu Ile Glu
275 280 285
His Leu Ile Val Glu Asp Ile Ile Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Thr Leu Glu Thr Ile Leu Met Ser Gln Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Phe Arg Lys Leu Val Pro Gly Tyr Gly Lys Ala Tyr Thr Ile
325 330 335
Leu Asn Gly Ser Leu Met Glu Thr Asn Val Tyr Tyr Lys Arg Val Asp
340 345 350
Lys Trp Ala Asp Ile Leu Pro Ser Lys Gly Cys Leu Lys Val Gly Gln
355 360 365
Gln Cys Met Glu Pro Val Lys Gly Val Leu Phe Asn Gly Ile Ile Lys
370 375 380
Gly Pro Asp Gly Gln Ile Leu Ile Pro Glu Met Gln Ser Glu Gln Leu
385 390 395 400
Lys Gln His Met Asp Leu Leu Lys Ala Ala Val Phe Pro Leu Arg His
405 410 415
Pro Leu Ile Ser Arg Glu Ala Val Phe Lys Lys Asp Gly Asp Ala Asp
420 425 430
Asp Phe Val Asp Leu His Met Pro Asp Val His Lys Ser Val Ser Asp
435 440 445
Val Asp Leu Gly Leu Pro His Trp Gly Phe Trp Met Leu Ile Gly Ala
450 455 460
Thr Ile Val Ala Phe Val Val Leu Val Cys Leu Leu Arg Val Cys Cys
465 470 475 480
Lys Arg Val Arg Arg Arg Arg Ser Gly Arg Ala Thr Gln Glu Ile Pro
485 490 495
Leu Ser Phe Pro Ser Ala Pro Val Pro Arg Ala Lys Val Val Ser Ser
500 505 510
Trp Glu Ser Tyr Lys Gly Leu Pro Gly Thr
515 520
<210> 481
<211> 1653
<212> DNA
<213> Morbillivirus Measles Virus
<400> 481
atggggctta aggccagtgt ctcagcgata ttcatgacgg tgctccttac gctccagacc 60
cctactgggc agatccattg gggcaacctg tcaaaaatag gtgtcgtagg gatcggctcc 120
gcatcatata aggtgatgac gcggtccagt caccagagct tggtgattaa gttgatgcct 180
aacatcactc ttctgaataa ttgtacgcgg gtggaaatcg cggagtatcg cagactcttg 240
cgcacggtac tcgagcctat tagggatgcg cttaacgcaa tgacgcagaa catcaggcct 300
gtacaatcag tagcatccag caggaggcat aaacgattcg cgggggttgt cctcgcgggg 360
gctgctctcg gtgttgccac cgctgcccaa attacggcgg gtatagcgct ccatcaatca 420
atgctgaata gccaggcgat agataacctg agagcgtcct tggagacaac taatcaggca 480
atcgaaacca ttagacaagc cggacaggaa atgattttgg ccgtccaggg aattcaagat 540
tacatcaata atgaattgat tccttcaatg aaccaattga gttgtgatct gattggccaa 600
aaactcggtt tgaaattgct gaggtactac acggagatcc tctctctttt tggcccatcc 660
ctccgcgatc caatttcagc agaaatctca atccaagctc tgagttatgc tctcggcggc 720
gatatcaaca aagtccttga aaagctcggt tatagtggtg gggacctgtt gggcatactc 780
gagtcccgag ggatcaaagc gcgaattact cacgtcgaca ctgaaagtta cttcatcgtt 840
ctgtctattg cttatcccac gttgagtgaa atcaagggag ttatagtcca ccgcttggag 900
ggcgtttcat ataatattgg ttcccaagag tggtacacga cagtgccaaa atacgttgcg 960
acccagggct atctcatcag caactttgac gagtcatctt gtactttcat gccagaagga 1020
acagtttgtt cacagaatgc cctgtatcct atgagcccgt tgctccaaga atgtctcagg 1080
ggatctacta aatcatgtgc gaggactctt gtaagcgggt cctttggaaa tcggtttatt 1140
cttagtcaag gaaatctcat agcgaactgt gcgagtattt tgtgtaaatg ttacacgacc 1200
ggtacgatca taaatcaaga cccagacaag attctgacct atattgctgc agactattgc 1260
cccgtggtag aggtaaatgg ggtgactata caggttgggt cacgcaaata tcccgatgcc 1320
gtgtacttgc acaggataga tttgggccct cctattagcc tcgaacgcct ggacgtaggg 1380
acgaacctgg gaaatgcggt cgctaagctc gaagacgcaa aagagctgct cgaatcatcc 1440
gatcagatac tgcggagtat gaagggtctg agttccacaa acattgttta cattcttatt 1500
gccgtttgct tggggggtct gattggcata cccactttga tttgttgttg ccgaggtcgc 1560
tgcaacaaaa aaggggggca ggtcggcatg agtcgaccgg gccttaagcc agacttgaca 1620
ggtacgagta aaagttacgt tcgctccctt tag 1653
<210> 482
<211> 550
<212> PRT
<213> Morbillivirus Measles Virus
<400> 482
Met Gly Leu Lys Ala Ser Val Ser Ala Ile Phe Met Thr Val Leu Leu
1 5 10 15
Thr Leu Gln Thr Pro Thr Gly Gln Ile His Trp Gly Asn Leu Ser Lys
20 25 30
Ile Gly Val Val Gly Ile Gly Ser Ala Ser Tyr Lys Val Met Thr Arg
35 40 45
Ser Ser His Gln Ser Leu Val Ile Lys Leu Met Pro Asn Ile Thr Leu
50 55 60
Leu Asn Asn Cys Thr Arg Val Glu Ile Ala Glu Tyr Arg Arg Leu Leu
65 70 75 80
Arg Thr Val Leu Glu Pro Ile Arg Asp Ala Leu Asn Ala Met Thr Gln
85 90 95
Asn Ile Arg Pro Val Gln Ser Val Ala Ser Ser Arg Arg His Lys Arg
100 105 110
Phe Ala Gly Val Val Leu Ala Gly Ala Ala Leu Gly Val Ala Thr Ala
115 120 125
Ala Gln Ile Thr Ala Gly Ile Ala Leu His Gln Ser Met Leu Asn Ser
130 135 140
Gln Ala Ile Asp Asn Leu Arg Ala Ser Leu Glu Thr Thr Asn Gln Ala
145 150 155 160
Ile Glu Thr Ile Arg Gln Ala Gly Gln Glu Met Ile Leu Ala Val Gln
165 170 175
Gly Ile Gln Asp Tyr Ile Asn Asn Glu Leu Ile Pro Ser Met Asn Gln
180 185 190
Leu Ser Cys Asp Leu Ile Gly Gln Lys Leu Gly Leu Lys Leu Leu Arg
195 200 205
Tyr Tyr Thr Glu Ile Leu Ser Leu Phe Gly Pro Ser Leu Arg Asp Pro
210 215 220
Ile Ser Ala Glu Ile Ser Ile Gln Ala Leu Ser Tyr Ala Leu Gly Gly
225 230 235 240
Asp Ile Asn Lys Val Leu Glu Lys Leu Gly Tyr Ser Gly Gly Asp Leu
245 250 255
Leu Gly Ile Leu Glu Ser Arg Gly Ile Lys Ala Arg Ile Thr His Val
260 265 270
Asp Thr Glu Ser Tyr Phe Ile Val Leu Ser Ile Ala Tyr Pro Thr Leu
275 280 285
Ser Glu Ile Lys Gly Val Ile Val His Arg Leu Glu Gly Val Ser Tyr
290 295 300
Asn Ile Gly Ser Gln Glu Trp Tyr Thr Thr Val Pro Lys Tyr Val Ala
305 310 315 320
Thr Gln Gly Tyr Leu Ile Ser Asn Phe Asp Glu Ser Ser Cys Thr Phe
325 330 335
Met Pro Glu Gly Thr Val Cys Ser Gln Asn Ala Leu Tyr Pro Met Ser
340 345 350
Pro Leu Leu Gln Glu Cys Leu Arg Gly Ser Thr Lys Ser Cys Ala Arg
355 360 365
Thr Leu Val Ser Gly Ser Phe Gly Asn Arg Phe Ile Leu Ser Gln Gly
370 375 380
Asn Leu Ile Ala Asn Cys Ala Ser Ile Leu Cys Lys Cys Tyr Thr Thr
385 390 395 400
Gly Thr Ile Ile Asn Gln Asp Pro Asp Lys Ile Leu Thr Tyr Ile Ala
405 410 415
Ala Asp Tyr Cys Pro Val Val Glu Val Asn Gly Val Thr Ile Gln Val
420 425 430
Gly Ser Arg Lys Tyr Pro Asp Ala Val Tyr Leu His Arg Ile Asp Leu
435 440 445
Gly Pro Pro Ile Ser Leu Glu Arg Leu Asp Val Gly Thr Asn Leu Gly
450 455 460
Asn Ala Val Ala Lys Leu Glu Asp Ala Lys Glu Leu Leu Glu Ser Ser
465 470 475 480
Asp Gln Ile Leu Arg Ser Met Lys Gly Leu Ser Ser Thr Asn Ile Val
485 490 495
Tyr Ile Leu Ile Ala Val Cys Leu Gly Gly Leu Ile Gly Ile Pro Thr
500 505 510
Leu Ile Cys Cys Cys Arg Gly Arg Cys Asn Lys Lys Gly Gly Gln Val
515 520 525
Gly Met Ser Arg Pro Gly Leu Lys Pro Asp Leu Thr Gly Thr Ser Lys
530 535 540
Ser Tyr Val Arg Ser Leu
545 550
<210> 483
<211> 1854
<212> DNA
<213> Morbillivirus Measles Virus
<400> 483
atgtcaccac aacgagaccg gataaatgcc ttctacaaag ataaccccca tcccaaggga 60
agtaggatag ttattaatag agaacatctt atgattgata gaccttatgt tttgctggct 120
gttctattcg tcatgtttct gagcttgatc gggttgctag ccattgcagg catcagactt 180
catcgggcag ccatctacac cgcagagatc cataaaagcc tcagcaccaa tctagatgta 240
actaactcaa tcgagcatca ggtcaaggac gtgctgacac cactcttcaa aatcatcggt 300
gatgaagtgg gcctgagaac acctcagaga ttcactgacc tagtgaaatt catctctgac 360
aagattaaat tcctcaatcc ggatagggag tacgacttca gagatctcac ttggtgtatc 420
aacccgccag agagaatcaa attggactat gatcaatact gtgcagatgt ggctgctgaa 480
gagctcatga atgcattggt gaactcaact ctactggaga ctaggacaac caatcagttc 540
ctagctgtct caaagggaaa ctgctcaggg cccactacaa tcagaggtca attctcaaac 600
atgtcgttgt ccctgttgga cttgtatttg agtcgaggtt acaatgtgtc atctatagtc 660
actatgacat cccagggaat gtacggggga acttacctag tggaaaagcc taatctgagc 720
agcaaagggt cagagttgcc acaaccaagc atgcaccgag tgtttgaagt aggtgtcatc 780
agaaatccgg gtttgggggc tccggtgttc catatgacaa actattttga gcagccagtc 840
agcaatgatt tcagcaactg tatggtggct ttgggggagc tcaaactcgc agctctttgc 900
cacggggaag attctatcac aattccctat cagggatcag ggaaaggtgt cagcttccag 960
ctcgtcaagc taggtgtctg gaaatcccca accgacatgc aatcctgggt ccccttatca 1020
acggatgatc cagtgataga caggctttac ctctcatctc acagaggtat tatcgctgac 1080
aatcaagcaa aatgggctgt cccgacaaca cgaacagatg acaagttgcg aatggagaca 1140
tgcttccagc aggcgtgtaa gggtaaaatc caagcactct gcgagaatcc cgagtgggca 1200
ccattgaagg ataacaggat tccttcatac ggggtcttgt ctgttgatct gagcctggca 1260
gttgagctta aaatcaaaat tgcttcagga ttcgggccat tgatcacaca cggttcaggg 1320
atggacctat acaaatccaa ccacaacaat gtgtattggc tgactatccc gccaatgaag 1380
aacctagcct taggtgtaat caacacattg gagtggatac cgagattcaa ggttagtccc 1440
aacctcttta ctgtcccaat taaggaagca ggcgaggact gccatgcccc gacataccta 1500
cctgcggagg tggatggtga tgtcaaactc agttccaatc tggtgattct acctggtcaa 1560
gatctccaat atgttttggc aacctacgat acttccaggg ttgaacatgc tgtggtttat 1620
tacgtttaca gcccaagccg ctcattttct tacttttatc cttttaggtt gcctataaag 1680
ggagtcccca tcgaattaca agtggaatgc ttcacatggg accaaaaact ctggtgccgt 1740
cacttctgtg tgcttgcaga ctcagaatct ggtggacata tcactcactc tgggatggtg 1800
ggtatgggag tcagctgcac agtcactcgg gaagatggaa ccaaccgcgg atag 1854
<210> 484
<211> 617
<212> PRT
<213> Morbillivirus Measles Virus
<400> 484
Met Ser Pro Gln Arg Asp Arg Ile Asn Ala Phe Tyr Lys Asp Asn Pro
1 5 10 15
His Pro Lys Gly Ser Arg Ile Val Ile Asn Arg Glu His Leu Met Ile
20 25 30
Asp Arg Pro Tyr Val Leu Leu Ala Val Leu Phe Val Met Phe Leu Ser
35 40 45
Leu Ile Gly Leu Leu Ala Ile Ala Gly Ile Arg Leu His Arg Ala Ala
50 55 60
Ile Tyr Thr Ala Glu Ile His Lys Ser Leu Ser Thr Asn Leu Asp Val
65 70 75 80
Thr Asn Ser Ile Glu His Gln Val Lys Asp Val Leu Thr Pro Leu Phe
85 90 95
Lys Ile Ile Gly Asp Glu Val Gly Leu Arg Thr Pro Gln Arg Phe Thr
100 105 110
Asp Leu Val Lys Phe Ile Ser Asp Lys Ile Lys Phe Leu Asn Pro Asp
115 120 125
Arg Glu Tyr Asp Phe Arg Asp Leu Thr Trp Cys Ile Asn Pro Pro Glu
130 135 140
Arg Ile Lys Leu Asp Tyr Asp Gln Tyr Cys Ala Asp Val Ala Ala Glu
145 150 155 160
Glu Leu Met Asn Ala Leu Val Asn Ser Thr Leu Leu Glu Thr Arg Thr
165 170 175
Thr Asn Gln Phe Leu Ala Val Ser Lys Gly Asn Cys Ser Gly Pro Thr
180 185 190
Thr Ile Arg Gly Gln Phe Ser Asn Met Ser Leu Ser Leu Leu Asp Leu
195 200 205
Tyr Leu Ser Arg Gly Tyr Asn Val Ser Ser Ile Val Thr Met Thr Ser
210 215 220
Gln Gly Met Tyr Gly Gly Thr Tyr Leu Val Glu Lys Pro Asn Leu Ser
225 230 235 240
Ser Lys Gly Ser Glu Leu Pro Gln Pro Ser Met His Arg Val Phe Glu
245 250 255
Val Gly Val Ile Arg Asn Pro Gly Leu Gly Ala Pro Val Phe His Met
260 265 270
Thr Asn Tyr Phe Glu Gln Pro Val Ser Asn Asp Phe Ser Asn Cys Met
275 280 285
Val Ala Leu Gly Glu Leu Lys Leu Ala Ala Leu Cys His Gly Glu Asp
290 295 300
Ser Ile Thr Ile Pro Tyr Gln Gly Ser Gly Lys Gly Val Ser Phe Gln
305 310 315 320
Leu Val Lys Leu Gly Val Trp Lys Ser Pro Thr Asp Met Gln Ser Trp
325 330 335
Val Pro Leu Ser Thr Asp Asp Pro Val Ile Asp Arg Leu Tyr Leu Ser
340 345 350
Ser His Arg Gly Ile Ile Ala Asp Asn Gln Ala Lys Trp Ala Val Pro
355 360 365
Thr Thr Arg Thr Asp Asp Lys Leu Arg Met Glu Thr Cys Phe Gln Gln
370 375 380
Ala Cys Lys Gly Lys Ile Gln Ala Leu Cys Glu Asn Pro Glu Trp Ala
385 390 395 400
Pro Leu Lys Asp Asn Arg Ile Pro Ser Tyr Gly Val Leu Ser Val Asp
405 410 415
Leu Ser Leu Ala Val Glu Leu Lys Ile Lys Ile Ala Ser Gly Phe Gly
420 425 430
Pro Leu Ile Thr His Gly Ser Gly Met Asp Leu Tyr Lys Ser Asn His
435 440 445
Asn Asn Val Tyr Trp Leu Thr Ile Pro Pro Met Lys Asn Leu Ala Leu
450 455 460
Gly Val Ile Asn Thr Leu Glu Trp Ile Pro Arg Phe Lys Val Ser Pro
465 470 475 480
Asn Leu Phe Thr Val Pro Ile Lys Glu Ala Gly Glu Asp Cys His Ala
485 490 495
Pro Thr Tyr Leu Pro Ala Glu Val Asp Gly Asp Val Lys Leu Ser Ser
500 505 510
Asn Leu Val Ile Leu Pro Gly Gln Asp Leu Gln Tyr Val Leu Ala Thr
515 520 525
Tyr Asp Thr Ser Arg Val Glu His Ala Val Val Tyr Tyr Val Tyr Ser
530 535 540
Pro Ser Arg Ser Phe Ser Tyr Phe Tyr Pro Phe Arg Leu Pro Ile Lys
545 550 555 560
Gly Val Pro Ile Glu Leu Gln Val Glu Cys Phe Thr Trp Asp Gln Lys
565 570 575
Leu Trp Cys Arg His Phe Cys Val Leu Ala Asp Ser Glu Ser Gly Gly
580 585 590
His Ile Thr His Ser Gly Met Val Gly Met Gly Val Ser Cys Thr Val
595 600 605
Thr Arg Glu Asp Gly Thr Asn Arg Gly
610 615
<210> 485
<211> 2031
<212> DNA
<213> Ebolavirus Ebola Zaire Virus
<400> 485
atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60
ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120
agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180
aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240
tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300
gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360
tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420
gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480
ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540
gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600
gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660
caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720
tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780
tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840
attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaaacct cactagaaaa 900
attcgcagtg aagagttgtc tttcacagtt gtatcaaacg gagccaaaaa catcagtggt 960
cagagtccgg cgcgaacttc ttccgaccca gggaccaaca caacaactga agaccacaaa 1020
atcatggctt cagaaaattc ctctgcaatg gttcaagtgc acagtcaagg aagggaagct 1080
gcagtgtcgc atctaacaac ccttgccaca atctccacga gtccccaatc cctcacaacc 1140
aaaccaggtc cggacaacag cacccataat acacccgtgt ataaacttga catctctgag 1200
gcaactcaag ttgaacaaca tcaccgcaga acagacaacg acagcacagc ctccgacact 1260
ccctctgcca cgaccgcagc cggaccccca aaagcagaga acaccaacac gagcaagagc 1320
actgacttcc tggaccccgc caccacaaca agtccccaaa accacagcga gaccgctggc 1380
aacaacaaca ctcatcacca agataccgga gaagagagtg ccagcagcgg gaagctaggc 1440
ttaattacca atactattgc tggagtcgca ggactgatca caggcgggag aagaactcga 1500
agagaagcaa ttgtcaatgc tcaacccaaa tgcaacccta atttacatta ctggactact 1560
caggatgaag gtgctgcaat cggactggcc tggataccat atttcgggcc agcagccgag 1620
ggaatttaca tagaggggct aatgcacaat caagatggtt taatctgtgg gttgagacag 1680
ctggccaacg agacgactca agctcttcaa ctgttcctga gagccacaac tgagctacgc 1740
accttttcaa tcctcaaccg taaggcaatt gatttcttgc tgcagcgatg gggcggcaca 1800
tgccacattc tgggaccgga ctgctgtatc gaaccacatg attggaccaa gaacataaca 1860
gacaaaattg atcagattat tcatgatttt gttgataaaa cccttccgga ccagggggac 1920
aatgacaatt ggtggacagg atggagacaa tggataccgg caggtattgg agttacaggc 1980
gttataattg cagttatcgc tttattctgt atatgcaaat ttgtctttta g 2031
<210> 486
<211> 676
<212> PRT
<213> Ebolavirus Ebola Zaire Virus
<400> 486
Met Gly Val Thr Gly Ile Leu Gln Leu Pro Arg Asp Arg Phe Lys Arg
1 5 10 15
Thr Ser Phe Phe Leu Trp Val Ile Ile Leu Phe Gln Arg Thr Phe Ser
20 25 30
Ile Pro Leu Gly Val Ile His Asn Ser Thr Leu Gln Val Ser Asp Val
35 40 45
Asp Lys Leu Val Cys Arg Asp Lys Leu Ser Ser Thr Asn Gln Leu Arg
50 55 60
Ser Val Gly Leu Asn Leu Glu Gly Asn Gly Val Ala Thr Asp Val Pro
65 70 75 80
Ser Ala Thr Lys Arg Trp Gly Phe Arg Ser Gly Val Pro Pro Lys Val
85 90 95
Val Asn Tyr Glu Ala Gly Glu Trp Ala Glu Asn Cys Tyr Asn Leu Glu
100 105 110
Ile Lys Lys Pro Asp Gly Ser Glu Cys Leu Pro Ala Ala Pro Asp Gly
115 120 125
Ile Arg Gly Phe Pro Arg Cys Arg Tyr Val His Lys Val Ser Gly Thr
130 135 140
Gly Pro Cys Ala Gly Asp Phe Ala Phe His Lys Glu Gly Ala Phe Phe
145 150 155 160
Leu Tyr Asp Arg Leu Ala Ser Thr Val Ile Tyr Arg Gly Thr Thr Phe
165 170 175
Ala Glu Gly Val Val Ala Phe Leu Ile Leu Pro Gln Ala Lys Lys Asp
180 185 190
Phe Phe Ser Ser His Pro Leu Arg Glu Pro Val Asn Ala Thr Glu Asp
195 200 205
Pro Ser Ser Gly Tyr Tyr Ser Thr Thr Ile Arg Tyr Gln Ala Thr Gly
210 215 220
Phe Gly Thr Asn Glu Thr Glu Tyr Leu Phe Glu Val Asp Asn Leu Thr
225 230 235 240
Tyr Val Gln Leu Glu Ser Arg Phe Thr Pro Gln Phe Leu Leu Gln Leu
245 250 255
Asn Glu Thr Ile Tyr Thr Ser Gly Lys Arg Ser Asn Thr Thr Gly Lys
260 265 270
Leu Ile Trp Lys Val Asn Pro Glu Ile Asp Thr Thr Ile Gly Glu Trp
275 280 285
Ala Phe Trp Glu Thr Lys Lys Asn Leu Thr Arg Lys Ile Arg Ser Glu
290 295 300
Glu Leu Ser Phe Thr Val Val Ser Asn Gly Ala Lys Asn Ile Ser Gly
305 310 315 320
Gln Ser Pro Ala Arg Thr Ser Ser Asp Pro Gly Thr Asn Thr Thr Thr
325 330 335
Glu Asp His Lys Ile Met Ala Ser Glu Asn Ser Ser Ala Met Val Gln
340 345 350
Val His Ser Gln Gly Arg Glu Ala Ala Val Ser His Leu Thr Thr Leu
355 360 365
Ala Thr Ile Ser Thr Ser Pro Gln Ser Leu Thr Thr Lys Pro Gly Pro
370 375 380
Asp Asn Ser Thr His Asn Thr Pro Val Tyr Lys Leu Asp Ile Ser Glu
385 390 395 400
Ala Thr Gln Val Glu Gln His His Arg Arg Thr Asp Asn Asp Ser Thr
405 410 415
Ala Ser Asp Thr Pro Ser Ala Thr Thr Ala Ala Gly Pro Pro Lys Ala
420 425 430
Glu Asn Thr Asn Thr Ser Lys Ser Thr Asp Phe Leu Asp Pro Ala Thr
435 440 445
Thr Thr Ser Pro Gln Asn His Ser Glu Thr Ala Gly Asn Asn Asn Thr
450 455 460
His His Gln Asp Thr Gly Glu Glu Ser Ala Ser Ser Gly Lys Leu Gly
465 470 475 480
Leu Ile Thr Asn Thr Ile Ala Gly Val Ala Gly Leu Ile Thr Gly Gly
485 490 495
Arg Arg Thr Arg Arg Glu Ala Ile Val Asn Ala Gln Pro Lys Cys Asn
500 505 510
Pro Asn Leu His Tyr Trp Thr Thr Gln Asp Glu Gly Ala Ala Ile Gly
515 520 525
Leu Ala Trp Ile Pro Tyr Phe Gly Pro Ala Ala Glu Gly Ile Tyr Ile
530 535 540
Glu Gly Leu Met His Asn Gln Asp Gly Leu Ile Cys Gly Leu Arg Gln
545 550 555 560
Leu Ala Asn Glu Thr Thr Gln Ala Leu Gln Leu Phe Leu Arg Ala Thr
565 570 575
Thr Glu Leu Arg Thr Phe Ser Ile Leu Asn Arg Lys Ala Ile Asp Phe
580 585 590
Leu Leu Gln Arg Trp Gly Gly Thr Cys His Ile Leu Gly Pro Asp Cys
595 600 605
Cys Ile Glu Pro His Asp Trp Thr Lys Asn Ile Thr Asp Lys Ile Asp
610 615 620
Gln Ile Ile His Asp Phe Val Asp Lys Thr Leu Pro Asp Gln Gly Asp
625 630 635 640
Asn Asp Asn Trp Trp Thr Gly Trp Arg Gln Trp Ile Pro Ala Gly Ile
645 650 655
Gly Val Thr Gly Val Ile Ile Ala Val Ile Ala Leu Phe Cys Ile Cys
660 665 670
Lys Phe Val Phe
675
<210> 487
<211> 1485
<212> DNA
<213> Flavivirus Dengue Virus
<400> 487
atgcggtgcg tgggaatagg aaacagagac ttcgtggaag gactgtcagg agctacgtgg 60
gtggatgtag ttctggagca tggaagttgc gtcactacca tggcaaaaga caaaccaaca 120
ctggacattg aactcctgaa gacggaggtc acaaaccctg ccgtcctgcg caaactgtgt 180
atagaagcta aaatatcaaa taccaccact gactcgagat gtccgacaca aggagaagcc 240
acgctggtgg aagaacaaga cacgaacttt gtgtgtcgac gaacattcgt ggacagaggc 300
tggggcaatg gttgtggact attcggaaag ggtagcttaa taacgtgtgc taagtttaag 360
tgtgtgacaa aattggaagg aaagatagtc caatatgaaa acttaaaata ttctgtgatc 420
gttaccgtcc acactggaga ccagcaccaa gttggaaatg agaccacaga acatggaaca 480
attgcaacca taacacctca agctcccacg tcggaaatac aactgacaga ctacggagct 540
ctaacactgg attgttcacc tagaacaggg ctagacttta atgagatggt gttgctgaca 600
atgaaagaaa aatcatggct cgtccacaaa caatggtttc tagacttacc actgccttgg 660
acctcagggg cctcaacgtc ccaagagact tggaacagac aagacttgct ggtcacgttt 720
aagacagctc atgcaaagaa gcaggaagta gtcgtactag gatcacaaga aggagcaatg 780
cacactgcgt tgactggagc gacagaaatc caaacgtctg gaacgacaac aatttttgca 840
ggccacctga aatgcagatt aaaaatggac aaactaactc taaaaggaat atcatatgta 900
atgtgcacag gctcattcaa gttagagaag gaagtggctg agacccagca tggaactgtt 960
ctagtacagg tcaaatacga aggaacagat gcaccatgca agatcccctt ctcgtcccaa 1020
gatgagaagg gagtaaccca gaatgggaga ttggtaacag ccaaccccat agtcactgac 1080
aaagaaaaac cagtcaacat tgaagcggag ccaccctttg gtgagagcta catcgtggta 1140
ggagcaggtg aaaaagcttt gaaactaagc tggttcaaga agggaagcag tatagggaaa 1200
atgtttgaag caactgcccg tggagcacga aggatggcca tcctgggaga caccgcatgg 1260
gacttcggct ctataggagg agtgttcacg tctgtgggaa aactggtaca ccagatcttt 1320
ggaactgcgt atggagtttt gttcagcggt gtttcttgga ccatgaaaat aggaataggg 1380
attctgctga catggctggg attaaactca aggagcacgt ccctttcaat gacgtgtatc 1440
gcagttggca tggtcacact gtacctagga gtcatggtcc aggcg 1485
<210> 488
<211> 495
<212> PRT
<213> Flavivirus Dengue Virus
<400> 488
Met Arg Cys Val Gly Ile Gly Asn Arg Asp Phe Val Glu Gly Leu Ser
1 5 10 15
Gly Ala Thr Trp Val Asp Val Val Leu Glu His Gly Ser Cys Val Thr
20 25 30
Thr Met Ala Lys Asp Lys Pro Thr Leu Asp Ile Glu Leu Leu Lys Thr
35 40 45
Glu Val Thr Asn Pro Ala Val Leu Arg Lys Leu Cys Ile Glu Ala Lys
50 55 60
Ile Ser Asn Thr Thr Thr Asp Ser Arg Cys Pro Thr Gln Gly Glu Ala
65 70 75 80
Thr Leu Val Glu Glu Gln Asp Thr Asn Phe Val Cys Arg Arg Thr Phe
85 90 95
Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser
100 105 110
Leu Ile Thr Cys Ala Lys Phe Lys Cys Val Thr Lys Leu Glu Gly Lys
115 120 125
Ile Val Gln Tyr Glu Asn Leu Lys Tyr Ser Val Ile Val Thr Val His
130 135 140
Thr Gly Asp Gln His Gln Val Gly Asn Glu Thr Thr Glu His Gly Thr
145 150 155 160
Ile Ala Thr Ile Thr Pro Gln Ala Pro Thr Ser Glu Ile Gln Leu Thr
165 170 175
Asp Tyr Gly Ala Leu Thr Leu Asp Cys Ser Pro Arg Thr Gly Leu Asp
180 185 190
Phe Asn Glu Met Val Leu Leu Thr Met Lys Glu Lys Ser Trp Leu Val
195 200 205
His Lys Gln Trp Phe Leu Asp Leu Pro Leu Pro Trp Thr Ser Gly Ala
210 215 220
Ser Thr Ser Gln Glu Thr Trp Asn Arg Gln Asp Leu Leu Val Thr Phe
225 230 235 240
Lys Thr Ala His Ala Lys Lys Gln Glu Val Val Val Leu Gly Ser Gln
245 250 255
Glu Gly Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Thr
260 265 270
Ser Gly Thr Thr Thr Ile Phe Ala Gly His Leu Lys Cys Arg Leu Lys
275 280 285
Met Asp Lys Leu Thr Leu Lys Gly Ile Ser Tyr Val Met Cys Thr Gly
290 295 300
Ser Phe Lys Leu Glu Lys Glu Val Ala Glu Thr Gln His Gly Thr Val
305 310 315 320
Leu Val Gln Val Lys Tyr Glu Gly Thr Asp Ala Pro Cys Lys Ile Pro
325 330 335
Phe Ser Ser Gln Asp Glu Lys Gly Val Thr Gln Asn Gly Arg Leu Val
340 345 350
Thr Ala Asn Pro Ile Val Thr Asp Lys Glu Lys Pro Val Asn Ile Glu
355 360 365
Ala Glu Pro Pro Phe Gly Glu Ser Tyr Ile Val Val Gly Ala Gly Glu
370 375 380
Lys Ala Leu Lys Leu Ser Trp Phe Lys Lys Gly Ser Ser Ile Gly Lys
385 390 395 400
Met Phe Glu Ala Thr Ala Arg Gly Ala Arg Arg Met Ala Ile Leu Gly
405 410 415
Asp Thr Ala Trp Asp Phe Gly Ser Ile Gly Gly Val Phe Thr Ser Val
420 425 430
Gly Lys Leu Val His Gln Ile Phe Gly Thr Ala Tyr Gly Val Leu Phe
435 440 445
Ser Gly Val Ser Trp Thr Met Lys Ile Gly Ile Gly Ile Leu Leu Thr
450 455 460
Trp Leu Gly Leu Asn Ser Arg Ser Thr Ser Leu Ser Met Thr Cys Ile
465 470 475 480
Ala Val Gly Met Val Thr Leu Tyr Leu Gly Val Met Val Gln Ala
485 490 495
<210> 489
<211> 1518
<212> DNA
<213> Flavivirus Zika virus
<400> 489
atgatcaggt gcataggagt cagcaatagg gactttgtgg aaggtatgtc aggtgggact 60
tgggttgatg ttgtcttgga acatggaggt tgtgtcaccg taatggcaca ggacaaaccg 120
actgtcgaca tagagctggt tacaacaaca gtcagcaaca tggcggaggt aagatcctac 180
tgctatgagg catcaatatc agacatggct tcggacagcc gctgcccaac acaaggtgaa 240
gcctaccttg acaagcaatc agacactcaa tatgtctgca aaagaacgtt agtggacaga 300
ggctggggaa atggatgtgg actttttggc aaagggagcc tggtgacatg cgctaagttt 360
gcatgctcca agaaaatgac cgggaagagc atccagccag agaatctgga gtaccggata 420
atgctgtcag ttcatggctc ccagcacagt gggatgatcg ttaatgacac aggacatgaa 480
actgatgaga atagagcgaa ggttgagata acgcccaatt caccaagagc cgaagccacc 540
ctggggggtt ttggaagcct aggacttgat tgtgaaccga ggacaggcct tgacttttca 600
gatttgtatt acttgactat gaataacaag cactggttgg tccacaagga gtggttccac 660
gacattccat taccttggca cgctggggca gacaccggaa ctccacactg gaacaacaaa 720
gaagcactgg tagagttcaa ggacgcacat gccaaaaggc aaactgtcgt ggttctaggg 780
agtcaagaag gagcagttca cacggccctt gctggagctc tggaggctga gatggatggt 840
gcaaagggaa ggctgtcctc tggccacttg aaatgtcgcc tgaaaatgga taaacttaga 900
ttgaagggcg tgtcatactc cttgtgtacc gcagcgttca cattcaccaa gatcccggct 960
gaaacactgc acgggacagt cacagtggag gtacagtacg cagggacaga tggaccttgc 1020
aaggttccag ctcagatggc ggtggacatg caaactctga ccccagttgg gaggttgata 1080
accgctaacc ccgtaatcac tgaaagcact gagaactcta agatgatgct ggaacttgat 1140
ccaccatttg gggactctta cattgtcata ggagtcgggg agaagaagat cacccaccac 1200
tggcacagga gtggcagcac cattggaaaa gcatttgaag ccactgtgag aggtgccaag 1260
agaatggcag tcttgggaga cacagcctgg gactttggat cagttggagg cgctctcaac 1320
tcattgggca agggcatcca tcaaattttt ggagcagctt tcaaatcatt gtttggagga 1380
atgtcctggt tctcacaaat cctcattgga acgttgctga tgtggttggg tctgaacaca 1440
aagaatggat ctatttccct tatgtgcttg gccttagggg gagtgttgat cttcttatcc 1500
acagccgtct ctgcttag 1518
<210> 490
<211> 505
<212> PRT
<213> Flavivirus Zika virus
<400> 490
Met Ile Arg Cys Ile Gly Val Ser Asn Arg Asp Phe Val Glu Gly Met
1 5 10 15
Ser Gly Gly Thr Trp Val Asp Val Val Leu Glu His Gly Gly Cys Val
20 25 30
Thr Val Met Ala Gln Asp Lys Pro Thr Val Asp Ile Glu Leu Val Thr
35 40 45
Thr Thr Val Ser Asn Met Ala Glu Val Arg Ser Tyr Cys Tyr Glu Ala
50 55 60
Ser Ile Ser Asp Met Ala Ser Asp Ser Arg Cys Pro Thr Gln Gly Glu
65 70 75 80
Ala Tyr Leu Asp Lys Gln Ser Asp Thr Gln Tyr Val Cys Lys Arg Thr
85 90 95
Leu Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly
100 105 110
Ser Leu Val Thr Cys Ala Lys Phe Ala Cys Ser Lys Lys Met Thr Gly
115 120 125
Lys Ser Ile Gln Pro Glu Asn Leu Glu Tyr Arg Ile Met Leu Ser Val
130 135 140
His Gly Ser Gln His Ser Gly Met Ile Val Asn Asp Thr Gly His Glu
145 150 155 160
Thr Asp Glu Asn Arg Ala Lys Val Glu Ile Thr Pro Asn Ser Pro Arg
165 170 175
Ala Glu Ala Thr Leu Gly Gly Phe Gly Ser Leu Gly Leu Asp Cys Glu
180 185 190
Pro Arg Thr Gly Leu Asp Phe Ser Asp Leu Tyr Tyr Leu Thr Met Asn
195 200 205
Asn Lys His Trp Leu Val His Lys Glu Trp Phe His Asp Ile Pro Leu
210 215 220
Pro Trp His Ala Gly Ala Asp Thr Gly Thr Pro His Trp Asn Asn Lys
225 230 235 240
Glu Ala Leu Val Glu Phe Lys Asp Ala His Ala Lys Arg Gln Thr Val
245 250 255
Val Val Leu Gly Ser Gln Glu Gly Ala Val His Thr Ala Leu Ala Gly
260 265 270
Ala Leu Glu Ala Glu Met Asp Gly Ala Lys Gly Arg Leu Ser Ser Gly
275 280 285
His Leu Lys Cys Arg Leu Lys Met Asp Lys Leu Arg Leu Lys Gly Val
290 295 300
Ser Tyr Ser Leu Cys Thr Ala Ala Phe Thr Phe Thr Lys Ile Pro Ala
305 310 315 320
Glu Thr Leu His Gly Thr Val Thr Val Glu Val Gln Tyr Ala Gly Thr
325 330 335
Asp Gly Pro Cys Lys Val Pro Ala Gln Met Ala Val Asp Met Gln Thr
340 345 350
Leu Thr Pro Val Gly Arg Leu Ile Thr Ala Asn Pro Val Ile Thr Glu
355 360 365
Ser Thr Glu Asn Ser Lys Met Met Leu Glu Leu Asp Pro Pro Phe Gly
370 375 380
Asp Ser Tyr Ile Val Ile Gly Val Gly Glu Lys Lys Ile Thr His His
385 390 395 400
Trp His Arg Ser Gly Ser Thr Ile Gly Lys Ala Phe Glu Ala Thr Val
405 410 415
Arg Gly Ala Lys Arg Met Ala Val Leu Gly Asp Thr Ala Trp Asp Phe
420 425 430
Gly Ser Val Gly Gly Ala Leu Asn Ser Leu Gly Lys Gly Ile His Gln
435 440 445
Ile Phe Gly Ala Ala Phe Lys Ser Leu Phe Gly Gly Met Ser Trp Phe
450 455 460
Ser Gln Ile Leu Ile Gly Thr Leu Leu Met Trp Leu Gly Leu Asn Thr
465 470 475 480
Lys Asn Gly Ser Ile Ser Leu Met Cys Leu Ala Leu Gly Gly Val Leu
485 490 495
Ile Phe Leu Ser Thr Ala Val Ser Ala
500 505
<210> 491
<211> 1284
<212> DNA
<213> Flavivirus West Nile Virus
<400> 491
atgttcaact gccttggaat gagcaacaga gacttcttgg aaggagtgtc tggagcaaca 60
tgggtggatt tggttctcga aggcgacagc tgcgtgacta tcatgtctaa ggacaagcct 120
accatcgatg tgaagatgat gaatatggag gcggccaacc tggcagaggt ccgcagttat 180
tgctatttgg ctaccgtcag cgatctctcc accaaagctg cgtgcccgac catgggagaa 240
gctcacaatg acaaacgtgc tgacccagct tttgtgtgca gacaaggagt ggtggacagg 300
ggctggggca acggctgcgg actatttggc aaaggaagca ttgacacatg cgccaaattt 360
gcctgctcta ccaaggcaat aggaagaacc atcttgaaag agaatatcaa gtacgaagtg 420
gccatttttg tccatggacc aactactgtg gagtcgcacg gaaactactc cacacaggtt 480
ggagccactc aggcagggag attcagcatc actcctgcgg cgccttcata cacactaaag 540
cttggagaat atggagaggt gacagtggac tgtgaaccac ggtcagggat tgacaccaat 600
gcatactacg tgatgactgt tggaacaaag acgttcttgg tccatcgtga gtggttcatg 660
gacctcaacc tcccttggag cagtgctgga agtactgtgt ggaggaacag agagacgtta 720
atggagtttg aagaaccaca cgccacgaag cagtctgtga tagcattggg ctcacaagag 780
ggagctctgc atcaagcttt ggctggagcc attcctgtgg aattttcaag caacactgtc 840
aagttgacgt cgggtcattt gaagtgtaga gtgaagatgg aaaaattgca gttgaaggga 900
acaacctatg gcgtctgttc aaaggctttc aagtttcttg ggactcccgc agacacaggt 960
cacggcactg tggtgttgga attgcagtac actggcacgg atggaccttg caaagttcct 1020
atctcgtcag tggcttcatt gaacgaccta acgccagtgg gcagattggt cactgtcaac 1080
ccttttgttt cagtggccac ggccaacgct aaggtcctga ttgaattgga accacccttt 1140
ggagactcat acatagtggt gggcagagga gaacaacaga tcaatcacca ttggcacaag 1200
tctggaagca gcattggcaa agcctttaca accaccctca aaggagcgca gagactagcc 1260
gctctaggag acacagcttg gtag 1284
<210> 492
<211> 427
<212> PRT
<213> Flavivirus West Nile Virus
<400> 492
Met Phe Asn Cys Leu Gly Met Ser Asn Arg Asp Phe Leu Glu Gly Val
1 5 10 15
Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys Val
20 25 30
Thr Ile Met Ser Lys Asp Lys Pro Thr Ile Asp Val Lys Met Met Asn
35 40 45
Met Glu Ala Ala Asn Leu Ala Glu Val Arg Ser Tyr Cys Tyr Leu Ala
50 55 60
Thr Val Ser Asp Leu Ser Thr Lys Ala Ala Cys Pro Thr Met Gly Glu
65 70 75 80
Ala His Asn Asp Lys Arg Ala Asp Pro Ala Phe Val Cys Arg Gln Gly
85 90 95
Val Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly
100 105 110
Ser Ile Asp Thr Cys Ala Lys Phe Ala Cys Ser Thr Lys Ala Ile Gly
115 120 125
Arg Thr Ile Leu Lys Glu Asn Ile Lys Tyr Glu Val Ala Ile Phe Val
130 135 140
His Gly Pro Thr Thr Val Glu Ser His Gly Asn Tyr Ser Thr Gln Val
145 150 155 160
Gly Ala Thr Gln Ala Gly Arg Phe Ser Ile Thr Pro Ala Ala Pro Ser
165 170 175
Tyr Thr Leu Lys Leu Gly Glu Tyr Gly Glu Val Thr Val Asp Cys Glu
180 185 190
Pro Arg Ser Gly Ile Asp Thr Asn Ala Tyr Tyr Val Met Thr Val Gly
195 200 205
Thr Lys Thr Phe Leu Val His Arg Glu Trp Phe Met Asp Leu Asn Leu
210 215 220
Pro Trp Ser Ser Ala Gly Ser Thr Val Trp Arg Asn Arg Glu Thr Leu
225 230 235 240
Met Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Ile Ala Leu
245 250 255
Gly Ser Gln Glu Gly Ala Leu His Gln Ala Leu Ala Gly Ala Ile Pro
260 265 270
Val Glu Phe Ser Ser Asn Thr Val Lys Leu Thr Ser Gly His Leu Lys
275 280 285
Cys Arg Val Lys Met Glu Lys Leu Gln Leu Lys Gly Thr Thr Tyr Gly
290 295 300
Val Cys Ser Lys Ala Phe Lys Phe Leu Gly Thr Pro Ala Asp Thr Gly
305 310 315 320
His Gly Thr Val Val Leu Glu Leu Gln Tyr Thr Gly Thr Asp Gly Pro
325 330 335
Cys Lys Val Pro Ile Ser Ser Val Ala Ser Leu Asn Asp Leu Thr Pro
340 345 350
Val Gly Arg Leu Val Thr Val Asn Pro Phe Val Ser Val Ala Thr Ala
355 360 365
Asn Ala Lys Val Leu Ile Glu Leu Glu Pro Pro Phe Gly Asp Ser Tyr
370 375 380
Ile Val Val Gly Arg Gly Glu Gln Gln Ile Asn His His Trp His Lys
385 390 395 400
Ser Gly Ser Ser Ile Gly Lys Ala Phe Thr Thr Thr Leu Lys Gly Ala
405 410 415
Gln Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp
420 425
<210> 493
<211> 1506
<212> DNA
<213> Flavivirus Japanese Encephalitis Virus
<400> 493
atgttcaact gtctgggaat gggcaatcgt gacttcatag aaggagccag tggagccact 60
tgggtggact tggtgctaga aggagatagc tgcttgacaa tcatggcaaa cgacaaacca 120
acattggacg tccgcatgat taacatcgaa gctagtcaac ttgctgaggt cagaagttac 180
tgctatcatg cttcagtcac tgacatctcg acggtggctc ggtgccccac gactggagaa 240
gcccacaacg agaagcgagc tgatagtagc tatgtgtgca aacaaggctt cactgatcgt 300
gggtggggca acggatgtgg actcttcggg aaggggagca ttgacacatg tgcaaaattc 360
tcctgcacta gcaaagcgat tgggagaaca atccagccag aaaacatcaa atacgaagtt 420
ggcatttttg tgcatggaac caccacttca gaaaaccatg ggaattattc agcgcaagtt 480
ggggcttccc aggcggcaaa gtttacagta acacccaatg ctccttcgat aaccctcaaa 540
cttggtgact acggagaagt cacgctggac tgtgagccaa ggagtggact gaacactgaa 600
gcgttttacg tcatgaccgt ggggtcaaag tcatttctgg tccataggga atggtttcat 660
gacctcgctc tcccctggac gtctccttcg agcacagcgt ggagaaacag agaactcctc 720
atggaatttg aagaagcgca cgccacaaaa cagtccgttg ttgctcttgg gtcacaggaa 780
ggaggcctcc atcaggcgct ggcaggggcc attgtggtgg agtactcaag ctcagtaaag 840
ctaacatcag gccacctgaa atgcaggcta aaaatggaca aactggccct gaaaggcaca 900
acctatggca tgtgtacagg aaaattctcg ttcgcgaaaa atccggcgga cactggccac 960
ggaacagttg tcattgaact ctcctactct gggagagacg gcccctgcaa aattccgatt 1020
gtctccgttg cgagccttaa tgacatgact cccgttgggc ggctggtgac agtgaaccct 1080
ttcgtcgcga cttccagtgc taactcaaag gtgctggtcg agatggaacc ccctttcgga 1140
gactcctaca tcgtggttgg gaggggagac aagcagatta accaccattg gcacaaagct 1200
ggaagcacgc taggcaaggc cttttcaaca actttgaagg gggctcaaag gctggcagcg 1260
ttgggcgaca cagcctggga ctttggctct attggagggg tcttcaactc cataggaaaa 1320
gccgtccacc aagtgtttgg tggtgccttc agaacactct tcgggggaat gtcttggatc 1380
acacaagggc taatgggtgc cctactgctt tggatgggcg tcaacgcacg agaccgatca 1440
attgctctgg ccttcttagc cacaggaggt gtgctcgtgt tcttagcgac caatgtgcat 1500
gcttag 1506
<210> 494
<211> 501
<212> PRT
<213> Flavivirus Japanese Encephalitis Virus
<400> 494
Met Phe Asn Cys Leu Gly Met Gly Asn Arg Asp Phe Ile Glu Gly Ala
1 5 10 15
Ser Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys Leu
20 25 30
Thr Ile Met Ala Asn Asp Lys Pro Thr Leu Asp Val Arg Met Ile Asn
35 40 45
Ile Glu Ala Ser Gln Leu Ala Glu Val Arg Ser Tyr Cys Tyr His Ala
50 55 60
Ser Val Thr Asp Ile Ser Thr Val Ala Arg Cys Pro Thr Thr Gly Glu
65 70 75 80
Ala His Asn Glu Lys Arg Ala Asp Ser Ser Tyr Val Cys Lys Gln Gly
85 90 95
Phe Thr Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly
100 105 110
Ser Ile Asp Thr Cys Ala Lys Phe Ser Cys Thr Ser Lys Ala Ile Gly
115 120 125
Arg Thr Ile Gln Pro Glu Asn Ile Lys Tyr Glu Val Gly Ile Phe Val
130 135 140
His Gly Thr Thr Thr Ser Glu Asn His Gly Asn Tyr Ser Ala Gln Val
145 150 155 160
Gly Ala Ser Gln Ala Ala Lys Phe Thr Val Thr Pro Asn Ala Pro Ser
165 170 175
Ile Thr Leu Lys Leu Gly Asp Tyr Gly Glu Val Thr Leu Asp Cys Glu
180 185 190
Pro Arg Ser Gly Leu Asn Thr Glu Ala Phe Tyr Val Met Thr Val Gly
195 200 205
Ser Lys Ser Phe Leu Val His Arg Glu Trp Phe His Asp Leu Ala Leu
210 215 220
Pro Trp Thr Ser Pro Ser Ser Thr Ala Trp Arg Asn Arg Glu Leu Leu
225 230 235 240
Met Glu Phe Glu Glu Ala His Ala Thr Lys Gln Ser Val Val Ala Leu
245 250 255
Gly Ser Gln Glu Gly Gly Leu His Gln Ala Leu Ala Gly Ala Ile Val
260 265 270
Val Glu Tyr Ser Ser Ser Val Lys Leu Thr Ser Gly His Leu Lys Cys
275 280 285
Arg Leu Lys Met Asp Lys Leu Ala Leu Lys Gly Thr Thr Tyr Gly Met
290 295 300
Cys Thr Gly Lys Phe Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His
305 310 315 320
Gly Thr Val Val Ile Glu Leu Ser Tyr Ser Gly Arg Asp Gly Pro Cys
325 330 335
Lys Ile Pro Ile Val Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val
340 345 350
Gly Arg Leu Val Thr Val Asn Pro Phe Val Ala Thr Ser Ser Ala Asn
355 360 365
Ser Lys Val Leu Val Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile
370 375 380
Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Ala
385 390 395 400
Gly Ser Thr Leu Gly Lys Ala Phe Ser Thr Thr Leu Lys Gly Ala Gln
405 410 415
Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Ile Gly
420 425 430
Gly Val Phe Asn Ser Ile Gly Lys Ala Val His Gln Val Phe Gly Gly
435 440 445
Ala Phe Arg Thr Leu Phe Gly Gly Met Ser Trp Ile Thr Gln Gly Leu
450 455 460
Met Gly Ala Leu Leu Leu Trp Met Gly Val Asn Ala Arg Asp Arg Ser
465 470 475 480
Ile Ala Leu Ala Phe Leu Ala Thr Gly Gly Val Leu Val Phe Leu Ala
485 490 495
Thr Asn Val His Ala
500
<210> 495
<211> 2179
<212> DNA
<213> Pegivirus Hepatitis G Virus
<400> 495
gcaaagcacg tgagatcgcc accatgtcac ttctcacgaa ccgctttatt cggcgagtag 60
ataaagacca atggggccca ggtgtgatgg gtaaagatcc caaaccttgt cctagccgct 120
gggcaggaaa gtgtatgggc ccaccaagct ccgccgcagc atgtagtcgc ggcagcccgc 180
gtatacttcg tgttcgggcg ggtggtattt ccttgttcta tacgataatg gctgtgctcc 240
tgctgctcct tgttgtcgaa gcgggtgcta tactggcccc agctacccat gcatgccgcg 300
cgaatggaca gtattttctg acaaattgct gtgcaccgga agacataggg ttttgtctcg 360
aaggtggctg tctcgtcgct ttgggctgca cagtttgtac tgatcggtgt tggccgctgt 420
atcaagcagg ccttgctgtg cgccctggga aaagcgctgc acagctggtt ggagagttgg 480
ggagcctgta cggccccctt tctgtctctg cctacgtggc gggcatattg ggtctgggtg 540
aggtctattc tggagttttg acggtcggtg ttgccctcag gcgaagagtc tatctgatgc 600
ctaatctcaa atgtgcagtg gaatgcgatg tcaagtgggg aagcgagttc tggagatgga 660
cggagcaact ggccagcaac tactggattc ttgaatatct gtggaaagtc cctttcgaat 720
tttggagagg cgtaatgtcc cttacacccc tgctcgtgtg ggtggccgcg ttgctccttc 780
tggagcaacg gatcgtgatg gttttccttc tggttacaat ggcagggatg ctccaaggtg 840
caccagcatc agtgctcgga tcaagacctt tcgactacgg gctgaaatgg cagtcctgta 900
gttgccgagc aaatggctcc aggatcccaa ctggtgaaag ggtatgggac cggggtaacg 960
tgacactgct gtgcgattgc ccaaatggac cgtgggtgtg ggtccccgcc ttttgtcagg 1020
cagtaggctg gggagatcca ataactcatt ggtcccacgg gcaaaaccaa tggcctttgt 1080
cctgtccgca atatgtatat ggctcagtgt cagtgacttg tgtttggggc tcagtctcct 1140
ggttcgcttc cacgggcggc agagattcca aaatagatgt ctggtctctt gtaccagtgg 1200
gctcagcctc atgcaccata gctgccttgg ggagctcaga tagggacact gtcgtggaac 1260
tctccgaatg gggtgtcccc tgtgtcacat gcattttgga tagaagacca gcttcatgtg 1320
gaacatgcgt tagggattgt tggcccgaaa ccggatccgt gcgttttccg ttccaccgct 1380
gcggaaccgg acctagactc actaaagatc tggaagccgt ccctttcgtt aataggacca 1440
ctcccttcac cattcgagga cctctgggta atcaaggccg gggaaacccc gtgcggagcc 1500
cacttggatt tggcagctac acaatgacga aaattcggga ctcattgcat cttgtgaaat 1560
gtccaacacc tgctattgag cccccgactg gcacctttgg attctttcct ggtgtgccac 1620
ccataaataa ttgcatgccg ctggggacgg aagtgagtga agcccttggc ggggcaggcc 1680
tgacgggtgg cttttatgaa ccactggtac gcagatgttc tgaactcatg ggacggcgga 1740
acccagtgtg ccctggctac gcatggctta gcagtggtcg gccagacggg ttcattcatg 1800
ttcaaggcca tttgcaggaa gtggacgccg gcaatttcat cccaccccct cgctggctgc 1860
tcctggactt tgtgtttgtg ctcctgtatc tgatgaagct ggcagaggcg aggttggtcc 1920
cactgatatt gctcctgctt tggtggtggg tcaatcagtt ggccgtgctc ggactgcccg 1980
cagtagacgc cgccgtggcc ggagaagttt tcgcaggccc cgccttgagt tggtgtctcg 2040
gattgcctac agtgagcatg atcctcggtc tcgcgaacct ggtgctttac ttccgctgga 2100
tggggccaca gaggttgatg tttctggttc tgtggaaatt ggctaggggt ttataagatc 2160
tgaattcacc ccaccagtg 2179
<210> 496
<211> 710
<212> PRT
<213> Pegivirus Hepatitis G Virus
<400> 496
Met Ser Leu Leu Thr Asn Arg Phe Ile Arg Arg Val Asp Lys Asp Gln
1 5 10 15
Trp Gly Pro Gly Val Met Gly Lys Asp Pro Lys Pro Cys Pro Ser Arg
20 25 30
Trp Ala Gly Lys Cys Met Gly Pro Pro Ser Ser Ala Ala Ala Cys Ser
35 40 45
Arg Gly Ser Pro Arg Ile Leu Arg Val Arg Ala Gly Gly Ile Ser Leu
50 55 60
Phe Tyr Thr Ile Met Ala Val Leu Leu Leu Leu Leu Val Val Glu Ala
65 70 75 80
Gly Ala Ile Leu Ala Pro Ala Thr His Ala Cys Arg Ala Asn Gly Gln
85 90 95
Tyr Phe Leu Thr Asn Cys Cys Ala Pro Glu Asp Ile Gly Phe Cys Leu
100 105 110
Glu Gly Gly Cys Leu Val Ala Leu Gly Cys Thr Val Cys Thr Asp Arg
115 120 125
Cys Trp Pro Leu Tyr Gln Ala Gly Leu Ala Val Arg Pro Gly Lys Ser
130 135 140
Ala Ala Gln Leu Val Gly Glu Leu Gly Ser Leu Tyr Gly Pro Leu Ser
145 150 155 160
Val Ser Ala Tyr Val Ala Gly Ile Leu Gly Leu Gly Glu Val Tyr Ser
165 170 175
Gly Val Leu Thr Val Gly Val Ala Leu Arg Arg Arg Val Tyr Leu Met
180 185 190
Pro Asn Leu Lys Cys Ala Val Glu Cys Asp Val Lys Trp Gly Ser Glu
195 200 205
Phe Trp Arg Trp Thr Glu Gln Leu Ala Ser Asn Tyr Trp Ile Leu Glu
210 215 220
Tyr Leu Trp Lys Val Pro Phe Glu Phe Trp Arg Gly Val Met Ser Leu
225 230 235 240
Thr Pro Leu Leu Val Trp Val Ala Ala Leu Leu Leu Leu Glu Gln Arg
245 250 255
Ile Val Met Val Phe Leu Leu Val Thr Met Ala Gly Met Leu Gln Gly
260 265 270
Ala Pro Ala Ser Val Leu Gly Ser Arg Pro Phe Asp Tyr Gly Leu Lys
275 280 285
Trp Gln Ser Cys Ser Cys Arg Ala Asn Gly Ser Arg Ile Pro Thr Gly
290 295 300
Glu Arg Val Trp Asp Arg Gly Asn Val Thr Leu Leu Cys Asp Cys Pro
305 310 315 320
Asn Gly Pro Trp Val Trp Val Pro Ala Phe Cys Gln Ala Val Gly Trp
325 330 335
Gly Asp Pro Ile Thr His Trp Ser His Gly Gln Asn Gln Trp Pro Leu
340 345 350
Ser Cys Pro Gln Tyr Val Tyr Gly Ser Val Ser Val Thr Cys Val Trp
355 360 365
Gly Ser Val Ser Trp Phe Ala Ser Thr Gly Gly Arg Asp Ser Lys Ile
370 375 380
Asp Val Trp Ser Leu Val Pro Val Gly Ser Ala Ser Cys Thr Ile Ala
385 390 395 400
Ala Leu Gly Ser Ser Asp Arg Asp Thr Val Val Glu Leu Ser Glu Trp
405 410 415
Gly Val Pro Cys Val Thr Cys Ile Leu Asp Arg Arg Pro Ala Ser Cys
420 425 430
Gly Thr Cys Val Arg Asp Cys Trp Pro Glu Thr Gly Ser Val Arg Phe
435 440 445
Pro Phe His Arg Cys Gly Thr Gly Pro Arg Leu Thr Lys Asp Leu Glu
450 455 460
Ala Val Pro Phe Val Asn Arg Thr Thr Pro Phe Thr Ile Arg Gly Pro
465 470 475 480
Leu Gly Asn Gln Gly Arg Gly Asn Pro Val Arg Ser Pro Leu Gly Phe
485 490 495
Gly Ser Tyr Thr Met Thr Lys Ile Arg Asp Ser Leu His Leu Val Lys
500 505 510
Cys Pro Thr Pro Ala Ile Glu Pro Pro Thr Gly Thr Phe Gly Phe Phe
515 520 525
Pro Gly Val Pro Pro Ile Asn Asn Cys Met Pro Leu Gly Thr Glu Val
530 535 540
Ser Glu Ala Leu Gly Gly Ala Gly Leu Thr Gly Gly Phe Tyr Glu Pro
545 550 555 560
Leu Val Arg Arg Cys Ser Glu Leu Met Gly Arg Arg Asn Pro Val Cys
565 570 575
Pro Gly Tyr Ala Trp Leu Ser Ser Gly Arg Pro Asp Gly Phe Ile His
580 585 590
Val Gln Gly His Leu Gln Glu Val Asp Ala Gly Asn Phe Ile Pro Pro
595 600 605
Pro Arg Trp Leu Leu Leu Asp Phe Val Phe Val Leu Leu Tyr Leu Met
610 615 620
Lys Leu Ala Glu Ala Arg Leu Val Pro Leu Ile Leu Leu Leu Leu Trp
625 630 635 640
Trp Trp Val Asn Gln Leu Ala Val Leu Gly Leu Pro Ala Val Asp Ala
645 650 655
Ala Val Ala Gly Glu Val Phe Ala Gly Pro Ala Leu Ser Trp Cys Leu
660 665 670
Gly Leu Pro Thr Val Ser Met Ile Leu Gly Leu Ala Asn Leu Val Leu
675 680 685
Tyr Phe Arg Trp Met Gly Pro Gln Arg Leu Met Phe Leu Val Leu Trp
690 695 700
Lys Leu Ala Arg Gly Leu
705 710
<210> 497
<211> 1666
<212> DNA
<213> Rubulavirus Mumps Virus F
<400> 497
gcaaagcacg tgagatcgcc accatgaaag tcttcctcgt gacctgtctt ggcttcgccg 60
tgttcagcag ttctgtgtgt gtgaatatca acatactgca gcagatcggc tatatcaaac 120
aacaagtgag gcagctctcc tattactctc agagtagcag ctcttacatt gtcgttaagc 180
tgctccccaa tattcaacca acagacaata gttgtgagtt taagtcagta acgcaatata 240
acaaaactct gtctaacctc ttgctcccta tagccgagaa cattaataac attgcatcac 300
catcatctgg aagcagaagg cataaacgct tcgctgggat tgccataggc attgcggccc 360
tcggcgtggc gacagctgcc caagtaaccg cggctgtcag cctcgttcaa gcccagacca 420
atgccagagc tatcgctgcg atgaagaata gcatccaggc cactaaccga gcagtcttcg 480
aagttaagga aggcacacag cggcttgcca tcgcggtaca agccattcaa gatcatatta 540
acacaattat gaatactcaa ctgaataaca tgtcatgtca gatccttgat aaccaactgg 600
ctacatctct gggcttgtac ctgaccgagc tgaccactgt ctttcagccc caactgatca 660
accctgccct gtcacctatc agcattcaag cactcaggtc acttcttggg tccatgactc 720
ccgctgtcgt gcaagctaca ctctcaacat ccatctctgc agccgaaatt ctgtccgctg 780
gcctcatgga aggccaaatt gtgagcgttc tcctcgatga gatgcagatg atagtcaaaa 840
ttaacattcc taccatagtg acgcaatcaa acgcactcgt aatcgacttt tacagtatct 900
ctagcttcat taataaccaa gaatctatca tccaattgcc agatcggatc cttgaaatcg 960
gaaatgaaca gtggagttat cctgcgaaga actgtaaatt gacgagacac cacatcttct 1020
gtcaatacaa tgaggccgaa agactcagcc tcgaatctaa actctgcttg gcaggcaata 1080
tcagcgcctg tgtattcagc cctatcgcag ggtcttatat gcggcgcttt gtagcactcg 1140
acggaacaat agtcgctaac tgccgatcat tgacctgtct gtgcaagagc cccagctacc 1200
ctatttatca acccgaccac catgctgtta ctacgattga cctcactgcg tgccagacct 1260
tgagcctcga tgggctcgat tttagtatag tctctctgag taatataaca tatgctgaaa 1320
acttgacaat cagcctgagt cagactatca acactcagcc cattgatatt tccacggaac 1380
ttagtaaagt aaacgccagc ctgcaaaacg cagttaaata tataaaggaa tccaatcatc 1440
aactccaaag cgtaaacgtt aatagcaaaa taggcgccat cattgtggct gcactggtcc 1500
tctcaatcct gtcaatcatt atcagccttt tgttctgttg ctgggcttac gtagccacta 1560
aagagatcag gcggatcaac ttcaaaacga accacattaa cacaatttca tctagcgtcg 1620
atgatctcat ccggtactta taagatctga attcacccca ccagtg 1666
<210> 498
<211> 539
<212> PRT
<213> Rubulavirus Mumps Virus F
<400> 498
Met Lys Val Phe Leu Val Thr Cys Leu Gly Phe Ala Val Phe Ser Ser
1 5 10 15
Ser Val Cys Val Asn Ile Asn Ile Leu Gln Gln Ile Gly Tyr Ile Lys
20 25 30
Gln Gln Val Arg Gln Leu Ser Tyr Tyr Ser Gln Ser Ser Ser Ser Tyr
35 40 45
Ile Val Val Lys Leu Leu Pro Asn Ile Gln Pro Thr Asp Asn Ser Cys
50 55 60
Glu Phe Lys Ser Val Thr Gln Tyr Asn Lys Thr Leu Ser Asn Leu Leu
65 70 75 80
Leu Pro Ile Ala Glu Asn Ile Asn Asn Ile Ala Ser Pro Ser Ser Gly
85 90 95
Ser Arg Arg His Lys Arg Phe Ala Gly Ile Ala Ile Gly Ile Ala Ala
100 105 110
Leu Gly Val Ala Thr Ala Ala Gln Val Thr Ala Ala Val Ser Leu Val
115 120 125
Gln Ala Gln Thr Asn Ala Arg Ala Ile Ala Ala Met Lys Asn Ser Ile
130 135 140
Gln Ala Thr Asn Arg Ala Val Phe Glu Val Lys Glu Gly Thr Gln Arg
145 150 155 160
Leu Ala Ile Ala Val Gln Ala Ile Gln Asp His Ile Asn Thr Ile Met
165 170 175
Asn Thr Gln Leu Asn Asn Met Ser Cys Gln Ile Leu Asp Asn Gln Leu
180 185 190
Ala Thr Ser Leu Gly Leu Tyr Leu Thr Glu Leu Thr Thr Val Phe Gln
195 200 205
Pro Gln Leu Ile Asn Pro Ala Leu Ser Pro Ile Ser Ile Gln Ala Leu
210 215 220
Arg Ser Leu Leu Gly Ser Met Thr Pro Ala Val Val Gln Ala Thr Leu
225 230 235 240
Ser Thr Ser Ile Ser Ala Ala Glu Ile Leu Ser Ala Gly Leu Met Glu
245 250 255
Gly Gln Ile Val Ser Val Leu Leu Asp Glu Met Gln Met Ile Val Lys
260 265 270
Ile Asn Ile Pro Thr Ile Val Thr Gln Ser Asn Ala Leu Val Ile Asp
275 280 285
Phe Tyr Ser Ile Ser Ser Phe Ile Asn Asn Gln Glu Ser Ile Ile Gln
290 295 300
Leu Pro Asp Arg Ile Leu Glu Ile Gly Asn Glu Gln Trp Ser Tyr Pro
305 310 315 320
Ala Lys Asn Cys Lys Leu Thr Arg His His Ile Phe Cys Gln Tyr Asn
325 330 335
Glu Ala Glu Arg Leu Ser Leu Glu Ser Lys Leu Cys Leu Ala Gly Asn
340 345 350
Ile Ser Ala Cys Val Phe Ser Pro Ile Ala Gly Ser Tyr Met Arg Arg
355 360 365
Phe Val Ala Leu Asp Gly Thr Ile Val Ala Asn Cys Arg Ser Leu Thr
370 375 380
Cys Leu Cys Lys Ser Pro Ser Tyr Pro Ile Tyr Gln Pro Asp His His
385 390 395 400
Ala Val Thr Thr Ile Asp Leu Thr Ala Cys Gln Thr Leu Ser Leu Asp
405 410 415
Gly Leu Asp Phe Ser Ile Val Ser Leu Ser Asn Ile Thr Tyr Ala Glu
420 425 430
Asn Leu Thr Ile Ser Leu Ser Gln Thr Ile Asn Thr Gln Pro Ile Asp
435 440 445
Ile Ser Thr Glu Leu Ser Lys Val Asn Ala Ser Leu Gln Asn Ala Val
450 455 460
Lys Tyr Ile Lys Glu Ser Asn His Gln Leu Gln Ser Val Asn Val Asn
465 470 475 480
Ser Lys Ile Gly Ala Ile Ile Val Ala Ala Leu Val Leu Ser Ile Leu
485 490 495
Ser Ile Ile Ile Ser Leu Leu Phe Cys Cys Trp Ala Tyr Val Ala Thr
500 505 510
Lys Glu Ile Arg Arg Ile Asn Phe Lys Thr Asn His Ile Asn Thr Ile
515 520 525
Ser Ser Ser Val Asp Asp Leu Ile Arg Tyr Leu
530 535
<210> 499
<211> 1798
<212> DNA
<213> Rubulavirus Mumps Virus HN
<400> 499
gcaaagcacg tgagatcgcc accatggaac ctagtaagct tttcaccatg tccgataatg 60
ctacattcgc accaggcccc gtcattaacg cagccgacaa gaaaacattc cgtacatgtt 120
tccgcattct ggtcctgtca gtccaggcag tcactcttat tctggtaatt gttactctgg 180
gcgaactcgt tcgcatgatt aacgaccagg gactgtctaa ccagctctcc tctattgccg 240
ataagatcag agagtccgcc accatgatcg catcagcagt cggagtgatg aatcaagtga 300
ttcatggggt gacagtttca ctgccactcc aaatagaagg aaatcaaaat cagcttctct 360
caactcttgc cacgatttgc acaggaaaga agcaggtttc taactgttct actaacatac 420
cattggtgaa tgatctgcgg tttattaatg ggatcaataa gttcatcatt gaagactatg 480
ctacgcatga cttcagcatt ggccacccgc tgaatatgcc tagttttatc ccaacagcca 540
caagccccaa tggttgcacc cggattccgt cctttagctt ggggaaaacc cattggtgct 600
atacccacaa tgttattaac gctaattgca aagatcatac atcttccaat caatacatta 660
gcatgggcat ccttgtacaa acggcctcag gctatcccat gtttaaaact ctgaaaatac 720
aatatctgag cgatggcctg aacaggaaga gttgctctat cgcaaccgtg cctgatgggt 780
gcgcaatgta ctgttatgtg agtacccaac ttgaaaccga tgactatgca ggctcttctc 840
cccctaccca gaaactgaca ctgctgttct ataacgatac tgttacggag cgtaccataa 900
gccccactgg acttgaaggt aattgggcta cccttgtgcc tggagtagga tccggtatct 960
actttgagaa taagctcata ttccctgcgt atggcggggt gctgcccaac agttctctcg 1020
gcgtcaagag tgcacgcgag ttcttcagac cagtgaaccc ctataatccc tgctcagggc 1080
cccaacaaga cttggatcag cgcgcactta gatcctattt tccttcctat tttagtaatc 1140
gtcgagtcca gagcgctttc ctcgtgtgtg cttggaatca gattttggta acaaactgtg 1200
aactggtcgt cccatccaat aatcaaaccc ttatgggagc agaagggcgg gtcctgctta 1260
ttaacaaccg actgctctac taccaaagaa gcacaagttg gtggccatac gaacttctct 1320
atgaaatttc cttcacattc accaacagtg gtcagagctc agtgaatatg agttggatac 1380
ccatatatag ctttacacga cctggatcag gcaactgtag cggggaaaat gtttgtccta 1440
cagcatgtgt aagtggcgtt tatctggatc cgtggccgct taccccatac tcccatcaat 1500
ccggtattaa ccgaaatttc tatttcactg gcgcactctt gaacagtagt acgacaagag 1560
taaaccccac cctgtacgtt tcagctttga acaatcttaa ggtgctggct ccatatggaa 1620
atcagggtct gtttgcttcc tacactacta caacatgttt ccaagatacc ggagatgcct 1680
ctgtatattg tgtgtatatc atggaactgg cgtcaaacat cgtcggcgaa tttcaaatat 1740
tgcccgtcct gactcggctg acaataacct tataagatct gaattcaccc caccagtg 1798
<210> 500
<211> 583
<212> PRT
<213> Rubulavirus Mumps Virus HN
<400> 500
Met Glu Pro Ser Lys Leu Phe Thr Met Ser Asp Asn Ala Thr Phe Ala
1 5 10 15
Pro Gly Pro Val Ile Asn Ala Ala Asp Lys Lys Thr Phe Arg Thr Cys
20 25 30
Phe Arg Ile Leu Val Leu Ser Val Gln Ala Val Thr Leu Ile Leu Val
35 40 45
Ile Val Thr Leu Gly Glu Leu Val Arg Met Ile Asn Asp Gln Gly Leu
50 55 60
Ser Asn Gln Leu Ser Ser Ile Ala Asp Lys Ile Arg Glu Ser Ala Thr
65 70 75 80
Met Ile Ala Ser Ala Val Gly Val Met Asn Gln Val Ile His Gly Val
85 90 95
Thr Val Ser Leu Pro Leu Gln Ile Glu Gly Asn Gln Asn Gln Leu Leu
100 105 110
Ser Thr Leu Ala Thr Ile Cys Thr Gly Lys Lys Gln Val Ser Asn Cys
115 120 125
Ser Thr Asn Ile Pro Leu Val Asn Asp Leu Arg Phe Ile Asn Gly Ile
130 135 140
Asn Lys Phe Ile Ile Glu Asp Tyr Ala Thr His Asp Phe Ser Ile Gly
145 150 155 160
His Pro Leu Asn Met Pro Ser Phe Ile Pro Thr Ala Thr Ser Pro Asn
165 170 175
Gly Cys Thr Arg Ile Pro Ser Phe Ser Leu Gly Lys Thr His Trp Cys
180 185 190
Tyr Thr His Asn Val Ile Asn Ala Asn Cys Lys Asp His Thr Ser Ser
195 200 205
Asn Gln Tyr Ile Ser Met Gly Ile Leu Val Gln Thr Ala Ser Gly Tyr
210 215 220
Pro Met Phe Lys Thr Leu Lys Ile Gln Tyr Leu Ser Asp Gly Leu Asn
225 230 235 240
Arg Lys Ser Cys Ser Ile Ala Thr Val Pro Asp Gly Cys Ala Met Tyr
245 250 255
Cys Tyr Val Ser Thr Gln Leu Glu Thr Asp Asp Tyr Ala Gly Ser Ser
260 265 270
Pro Pro Thr Gln Lys Leu Thr Leu Leu Phe Tyr Asn Asp Thr Val Thr
275 280 285
Glu Arg Thr Ile Ser Pro Thr Gly Leu Glu Gly Asn Trp Ala Thr Leu
290 295 300
Val Pro Gly Val Gly Ser Gly Ile Tyr Phe Glu Asn Lys Leu Ile Phe
305 310 315 320
Pro Ala Tyr Gly Gly Val Leu Pro Asn Ser Ser Leu Gly Val Lys Ser
325 330 335
Ala Arg Glu Phe Phe Arg Pro Val Asn Pro Tyr Asn Pro Cys Ser Gly
340 345 350
Pro Gln Gln Asp Leu Asp Gln Arg Ala Leu Arg Ser Tyr Phe Pro Ser
355 360 365
Tyr Phe Ser Asn Arg Arg Val Gln Ser Ala Phe Leu Val Cys Ala Trp
370 375 380
Asn Gln Ile Leu Val Thr Asn Cys Glu Leu Val Val Pro Ser Asn Asn
385 390 395 400
Gln Thr Leu Met Gly Ala Glu Gly Arg Val Leu Leu Ile Asn Asn Arg
405 410 415
Leu Leu Tyr Tyr Gln Arg Ser Thr Ser Trp Trp Pro Tyr Glu Leu Leu
420 425 430
Tyr Glu Ile Ser Phe Thr Phe Thr Asn Ser Gly Gln Ser Ser Val Asn
435 440 445
Met Ser Trp Ile Pro Ile Tyr Ser Phe Thr Arg Pro Gly Ser Gly Asn
450 455 460
Cys Ser Gly Glu Asn Val Cys Pro Thr Ala Cys Val Ser Gly Val Tyr
465 470 475 480
Leu Asp Pro Trp Pro Leu Thr Pro Tyr Ser His Gln Ser Gly Ile Asn
485 490 495
Arg Asn Phe Tyr Phe Thr Gly Ala Leu Leu Asn Ser Ser Thr Thr Arg
500 505 510
Val Asn Pro Thr Leu Tyr Val Ser Ala Leu Asn Asn Leu Lys Val Leu
515 520 525
Ala Pro Tyr Gly Asn Gln Gly Leu Phe Ala Ser Tyr Thr Thr Thr Thr
530 535 540
Cys Phe Gln Asp Thr Gly Asp Ala Ser Val Tyr Cys Val Tyr Ile Met
545 550 555 560
Glu Leu Ala Ser Asn Ile Val Gly Glu Phe Gln Ile Leu Pro Val Leu
565 570 575
Thr Arg Leu Thr Ile Thr Leu
580
<210> 501
<211> 1747
<212> DNA
<213> Respirovirus Sendai Virus F
<400> 501
gcaaagcacg tgagatcgcc accatgactg catacattca aagaagccaa tgcattagca 60
caagtctcct tgtggtgctg acgaccctcg tttcctgtca gatcccgcgt gatcgacttt 120
ccaatatcgg ggttattgtc gacgagggca agtccttgaa aatcgcaggt tcccacgagt 180
ctaggtacat cgtgctgtca ctggttcccg gcgtcgactt tgagaatggt tgcggtacag 240
cccaagtaat tcagtacaag agcctgctca acaggcttct gatccctctc cgagatgcct 300
tggatctgca agaagctctg attactgtga cgaacgacac gactcaaaat gccggggctc 360
cacagtctcg cttcttcggc gcagtgatcg gcacgatcgc tctgggcgtt gccacttccg 420
ctcagatcac cgctggtatt gcccttgctg aagctcggga agccaaacgt gatattgcgc 480
tgataaagga gagcatgaca aagactcata agtcaatcga actgcttcag aacgccgtgg 540
gagagcaaat tcttgctctc aaaaccctgc aggacttcgt gaatgatgag attaaaccag 600
ccatcagtga actgggttgc gagactgctg ctctgcgtct gggaattaaa ctgacccaac 660
attactccga gctcctcact gctttcggct ctaactttgg aacgattgga gagaaaagcc 720
tgacccttca ggctctctct tctctctact ccgccaacat cacagagatt atgacgacga 780
tcaaaacggg gcaatccaac atttatgatg tcatttatac tgagcagatc aaaggtaccg 840
tgatcgatgt tgacctggaa aggtacatgg tgacactctc agtcaaaatc cccatcctca 900
gtgaggtgcc aggcgtattg attcataaag caagcagcat tagctataac atagatgggg 960
aagagtggta cgttaccgtc cccagtcata tactgtctag agccagtttc ctcggtggtg 1020
cagatataac cgactgtgtg gagagccggc tgacctatat ttgtccgcgc gatcccgcac 1080
aattgattcc agacagccag caaaagtgca tcctcgggga caccacacga tgtcctgtta 1140
cgaaggtagt cgactcactg atccccaagt tcgccttcgt caacggtggc gtagttgcca 1200
attgcattgc cagcacttgt acatgtggca caggacgcag acctattagc caagatcgtt 1260
caaagggcgt ggttttcctc acacacgata attgcggact gataggggtg aacggtgttg 1320
aactttacgc taaccgcaga ggacacgatg caacatgggg cgtacagaat ttgacagtcg 1380
ggcctgcaat tgcaatacgt cctatcgaca tctctctcaa cctggcggac gctaccaatt 1440
ttctgcaaga ctccaaggct gaacttgaga aagcgaggaa gattctgtcc gaagtcggcc 1500
gatggtataa ctctcgggaa actgtcatta ccatcattgt cgtgatggtt gtcattttgg 1560
tggtgatcat tgtgataatt attgtcctct ataggctgag gagatctatg ctgatgggta 1620
acccggatga cagaatccca cgcgacacgt acacccttga gccgaaaatt cggcatatgt 1680
atacgaatgg tggatttgat gcaatggcgg aaaagcgctt ataagatctg aattcacccc 1740
accagtg 1747
<210> 502
<211> 566
<212> PRT
<213> Respirovirus Sendai Virus F
<400> 502
Met Thr Ala Tyr Ile Gln Arg Ser Gln Cys Ile Ser Thr Ser Leu Leu
1 5 10 15
Val Val Leu Thr Thr Leu Val Ser Cys Gln Ile Pro Arg Asp Arg Leu
20 25 30
Ser Asn Ile Gly Val Ile Val Asp Glu Gly Lys Ser Leu Lys Ile Ala
35 40 45
Gly Ser His Glu Ser Arg Tyr Ile Val Leu Ser Leu Val Pro Gly Val
50 55 60
Asp Phe Glu Asn Gly Cys Gly Thr Ala Gln Val Ile Gln Tyr Lys Ser
65 70 75 80
Leu Leu Asn Arg Leu Leu Ile Pro Leu Arg Asp Ala Leu Asp Leu Gln
85 90 95
Glu Ala Leu Ile Thr Val Thr Asn Asp Thr Thr Gln Asn Ala Gly Ala
100 105 110
Pro Gln Ser Arg Phe Phe Gly Ala Val Ile Gly Thr Ile Ala Leu Gly
115 120 125
Val Ala Thr Ser Ala Gln Ile Thr Ala Gly Ile Ala Leu Ala Glu Ala
130 135 140
Arg Glu Ala Lys Arg Asp Ile Ala Leu Ile Lys Glu Ser Met Thr Lys
145 150 155 160
Thr His Lys Ser Ile Glu Leu Leu Gln Asn Ala Val Gly Glu Gln Ile
165 170 175
Leu Ala Leu Lys Thr Leu Gln Asp Phe Val Asn Asp Glu Ile Lys Pro
180 185 190
Ala Ile Ser Glu Leu Gly Cys Glu Thr Ala Ala Leu Arg Leu Gly Ile
195 200 205
Lys Leu Thr Gln His Tyr Ser Glu Leu Leu Thr Ala Phe Gly Ser Asn
210 215 220
Phe Gly Thr Ile Gly Glu Lys Ser Leu Thr Leu Gln Ala Leu Ser Ser
225 230 235 240
Leu Tyr Ser Ala Asn Ile Thr Glu Ile Met Thr Thr Ile Lys Thr Gly
245 250 255
Gln Ser Asn Ile Tyr Asp Val Ile Tyr Thr Glu Gln Ile Lys Gly Thr
260 265 270
Val Ile Asp Val Asp Leu Glu Arg Tyr Met Val Thr Leu Ser Val Lys
275 280 285
Ile Pro Ile Leu Ser Glu Val Pro Gly Val Leu Ile His Lys Ala Ser
290 295 300
Ser Ile Ser Tyr Asn Ile Asp Gly Glu Glu Trp Tyr Val Thr Val Pro
305 310 315 320
Ser His Ile Leu Ser Arg Ala Ser Phe Leu Gly Gly Ala Asp Ile Thr
325 330 335
Asp Cys Val Glu Ser Arg Leu Thr Tyr Ile Cys Pro Arg Asp Pro Ala
340 345 350
Gln Leu Ile Pro Asp Ser Gln Gln Lys Cys Ile Leu Gly Asp Thr Thr
355 360 365
Arg Cys Pro Val Thr Lys Val Val Asp Ser Leu Ile Pro Lys Phe Ala
370 375 380
Phe Val Asn Gly Gly Val Val Ala Asn Cys Ile Ala Ser Thr Cys Thr
385 390 395 400
Cys Gly Thr Gly Arg Arg Pro Ile Ser Gln Asp Arg Ser Lys Gly Val
405 410 415
Val Phe Leu Thr His Asp Asn Cys Gly Leu Ile Gly Val Asn Gly Val
420 425 430
Glu Leu Tyr Ala Asn Arg Arg Gly His Asp Ala Thr Trp Gly Val Gln
435 440 445
Asn Leu Thr Val Gly Pro Ala Ile Ala Ile Arg Pro Ile Asp Ile Ser
450 455 460
Leu Asn Leu Ala Asp Ala Thr Asn Phe Leu Gln Asp Ser Lys Ala Glu
465 470 475 480
Leu Glu Lys Ala Arg Lys Ile Leu Ser Glu Val Gly Arg Trp Tyr Asn
485 490 495
Ser Arg Glu Thr Val Ile Thr Ile Ile Val Val Met Val Val Ile Leu
500 505 510
Val Val Ile Ile Val Ile Ile Ile Val Leu Tyr Arg Leu Arg Arg Ser
515 520 525
Met Leu Met Gly Asn Pro Asp Asp Arg Ile Pro Arg Asp Thr Tyr Thr
530 535 540
Leu Glu Pro Lys Ile Arg His Met Tyr Thr Asn Gly Gly Phe Asp Ala
545 550 555 560
Met Ala Glu Lys Arg Leu
565
<210> 503
<211> 1777
<212> DNA
<213> Respirovirus Sendai Virus HN
<400> 503
gcaaagcacg tgagatcgcc accatggatg gcgaccgagg caaacgcgac tcttattgga 60
gcacttcccc tagtgggtcc accactaagc cggctagcgg atgggagaga tcaagtaagg 120
ccgatacgtg gctcttgatc ttgagcttca cccaatgggc tttgagtatt gctactgtta 180
ttatttgcat catcatctca gctcggcaag gatactctat gaaagagtac agcatgacgg 240
tggaagcatt gaatatgtct tctcgggaag tgaaggaatc actcacatct ttgattaggc 300
aggaagtcat agcccgggct gtgaatatcc aatccagcgt ccaaacaggg atcccggtgc 360
tcctgaacaa gaactcccga gacgtcatcc aaatgatcga taaatcttgt tcacgccaag 420
aacttaccca acattgtgaa agcactattg ccgtccatca cgcagacggc attgcacccc 480
tggagccgca ctcattctgg cgttgcccgg ttggtgaacc ctatctgtca tctgaccccg 540
agatcagtct gctccctgga ccttcactcc tctccggttc caccacgata agcgggtgtg 600
tcaggttgcc atccctctcc atcggggaag cgatttatgc gtatagcagc aacttgatta 660
cgcaaggctg tgctgacatc ggtaagtcct accaggtgct tcagcttggt tatatcagcc 720
ttaattctga tatgtttccg gacctcaatc ctgtggtctc acatacatat gacatcaatg 780
acaacagaaa atcctgtagc gtagtcgcaa cagggacgag agggtatcaa ctctgttcta 840
tgcctacagt cgacgagaga actgattata gctcagacgg aatcgaagat ctcgtcctgg 900
acgttctcga tttgaaaggt cgcacaaaat cacaccgcta cagaaattcc gaggtggacc 960
tcgatcatcc tttctccgcg ttgtatccta gtgtgggcaa cggcattgct actgaaggct 1020
ccttgatttt cctcgggtac ggcggcctca ccacaccctt gcaaggtgat acaaaatgcc 1080
gtacgcaagg ctgccaacag gtttctcaag atacttgcaa cgaggctctg aagataactt 1140
ggcttggcgg gaaacaagtg gtttctgtga tcattcaggt caatgattac ctgagtgaaa 1200
ggcctaaaat tagggtcacc accattccca ttacccaaaa ctatctcggt gctgagggca 1260
ggctgttgaa gctcggtgat cgggtctata tatatactcg gagcagtggt tggcactctc 1320
aactgcaaat aggggtcttg gacgtgtccc acccgttgac cattaattgg acacctcatg 1380
aggcgctgtc acggccaggg aataaagaat gcaactggta caataagtgc cccaaagaat 1440
gtatctccgg ggtctacaca gacgcttacc ccctgtctcc agatgctgct aatgtcgcta 1500
cagttactct gtacgccaat acttctagag tgaaccccac tattatgtat tccaacacga 1560
ccaatataat caatatgctt cggataaaag atgtacaact tgaagccgct tacactacta 1620
cgtcctgtat aacacacttt gggaaaggct attgctttca catcattgag attaatcaaa 1680
agagtctgaa tactctccaa cccatgctgt ttaaaacatc aatcccaaaa ttgtgtaaag 1740
cggaaagttt ataagatctg aattcacccc accagtg 1777
<210> 504
<211> 576
<212> PRT
<213> Respirovirus Sendai Virus HN
<400> 504
Met Asp Gly Asp Arg Gly Lys Arg Asp Ser Tyr Trp Ser Thr Ser Pro
1 5 10 15
Ser Gly Ser Thr Thr Lys Pro Ala Ser Gly Trp Glu Arg Ser Ser Lys
20 25 30
Ala Asp Thr Trp Leu Leu Ile Leu Ser Phe Thr Gln Trp Ala Leu Ser
35 40 45
Ile Ala Thr Val Ile Ile Cys Ile Ile Ile Ser Ala Arg Gln Gly Tyr
50 55 60
Ser Met Lys Glu Tyr Ser Met Thr Val Glu Ala Leu Asn Met Ser Ser
65 70 75 80
Arg Glu Val Lys Glu Ser Leu Thr Ser Leu Ile Arg Gln Glu Val Ile
85 90 95
Ala Arg Ala Val Asn Ile Gln Ser Ser Val Gln Thr Gly Ile Pro Val
100 105 110
Leu Leu Asn Lys Asn Ser Arg Asp Val Ile Gln Met Ile Asp Lys Ser
115 120 125
Cys Ser Arg Gln Glu Leu Thr Gln His Cys Glu Ser Thr Ile Ala Val
130 135 140
His His Ala Asp Gly Ile Ala Pro Leu Glu Pro His Ser Phe Trp Arg
145 150 155 160
Cys Pro Val Gly Glu Pro Tyr Leu Ser Ser Asp Pro Glu Ile Ser Leu
165 170 175
Leu Pro Gly Pro Ser Leu Leu Ser Gly Ser Thr Thr Ile Ser Gly Cys
180 185 190
Val Arg Leu Pro Ser Leu Ser Ile Gly Glu Ala Ile Tyr Ala Tyr Ser
195 200 205
Ser Asn Leu Ile Thr Gln Gly Cys Ala Asp Ile Gly Lys Ser Tyr Gln
210 215 220
Val Leu Gln Leu Gly Tyr Ile Ser Leu Asn Ser Asp Met Phe Pro Asp
225 230 235 240
Leu Asn Pro Val Val Ser His Thr Tyr Asp Ile Asn Asp Asn Arg Lys
245 250 255
Ser Cys Ser Val Val Ala Thr Gly Thr Arg Gly Tyr Gln Leu Cys Ser
260 265 270
Met Pro Thr Val Asp Glu Arg Thr Asp Tyr Ser Ser Asp Gly Ile Glu
275 280 285
Asp Leu Val Leu Asp Val Leu Asp Leu Lys Gly Arg Thr Lys Ser His
290 295 300
Arg Tyr Arg Asn Ser Glu Val Asp Leu Asp His Pro Phe Ser Ala Leu
305 310 315 320
Tyr Pro Ser Val Gly Asn Gly Ile Ala Thr Glu Gly Ser Leu Ile Phe
325 330 335
Leu Gly Tyr Gly Gly Leu Thr Thr Pro Leu Gln Gly Asp Thr Lys Cys
340 345 350
Arg Thr Gln Gly Cys Gln Gln Val Ser Gln Asp Thr Cys Asn Glu Ala
355 360 365
Leu Lys Ile Thr Trp Leu Gly Gly Lys Gln Val Val Ser Val Ile Ile
370 375 380
Gln Val Asn Asp Tyr Leu Ser Glu Arg Pro Lys Ile Arg Val Thr Thr
385 390 395 400
Ile Pro Ile Thr Gln Asn Tyr Leu Gly Ala Glu Gly Arg Leu Leu Lys
405 410 415
Leu Gly Asp Arg Val Tyr Ile Tyr Thr Arg Ser Ser Gly Trp His Ser
420 425 430
Gln Leu Gln Ile Gly Val Leu Asp Val Ser His Pro Leu Thr Ile Asn
435 440 445
Trp Thr Pro His Glu Ala Leu Ser Arg Pro Gly Asn Lys Glu Cys Asn
450 455 460
Trp Tyr Asn Lys Cys Pro Lys Glu Cys Ile Ser Gly Val Tyr Thr Asp
465 470 475 480
Ala Tyr Pro Leu Ser Pro Asp Ala Ala Asn Val Ala Thr Val Thr Leu
485 490 495
Tyr Ala Asn Thr Ser Arg Val Asn Pro Thr Ile Met Tyr Ser Asn Thr
500 505 510
Thr Asn Ile Ile Asn Met Leu Arg Ile Lys Asp Val Gln Leu Glu Ala
515 520 525
Ala Tyr Thr Thr Thr Ser Cys Ile Thr His Phe Gly Lys Gly Tyr Cys
530 535 540
Phe His Ile Ile Glu Ile Asn Gln Lys Ser Leu Asn Thr Leu Gln Pro
545 550 555 560
Met Leu Phe Lys Thr Ser Ile Pro Lys Leu Cys Lys Ala Glu Ser Leu
565 570 575
<210> 505
<211> 1590
<212> DNA
<213> Alphabaculovirus Autographa californica nuclear polyhedrosis virus
<400> 505
atgctgctcg tgaaccagag ccaccagggc ttcaacaagg agcatacatc caaaatggtg 60
tccgccatcg tgctgtacgt gctgctggcc gccgctgccc acagcgcttt tgccgccgag 120
cattgtaatg ctcagatgaa aaccggccct tacaagatca agaacctgga catcacccct 180
cctaaggaga cactgcaaaa agacgtggaa atcaccatcg tggaaaccga ctacaatgag 240
aacgtgatca tcggatataa gggctactac caggcctacg cctacaacgg cggaagcctg 300
gatcctaaca ccagagtgga agagaccatg aagaccctga acgtgggaaa ggaagatctg 360
ctgatgtgga gcatccggca acagtgtgaa gtgggcgaag agctgattga tagatggggc 420
tcagattctg acgattgctt cagagacaac gagggcagag gccagtgggt gaagggcaag 480
gagctggtca agcggcagaa caacaaccac ttcgcccatc acacatgcaa caaaagctgg 540
cggtgcggca tctccacctc taagatgtat tctagactgg aatgtcagga cgacaccgac 600
gagtgccagg tgtacatcct ggacgctgaa ggaaacccta tcaacgtgac agttgacacc 660
gtgctgcacc gggacggcgt gtctatgatc ctgaagcaga agagcacatt caccaccaga 720
cagatcaagg ccgcatgcct gcttatcaaa gacgacaaga acaaccccga gagcgtgacc 780
agagaacact gcctgatcga caacgacatc tacgacctga gcaagaatac ttggaactgt 840
aaattcaaca ggtgcatcaa gcggaaggtg gagcacagag tgaagaagcg tccaccaacc 900
tggcgccaca acgtcagagc caagtacaca gagggcgaca cagccacaaa gggagatctg 960
atgcacatcc aggaggaact gatgtacgag aatgacctgc ttaaaatgaa catcgagctg 1020
atgcacgccc acatcaacaa gctgaacaac atgctgcacg acctgatcgt tagcgtggcc 1080
aaggtggacg agagactgat cggcaatctg atgaacaaca gcgtgtccag caccttcctg 1140
tctgatgaca cctttctgct catgccttgc accaaccccc ccgcccacac cagcaactgc 1200
tacaacaaca gcatctacaa ggaaggcaga tgggtcgcta ataccgatag cagtcagtgc 1260
atcgacttca gcaattacaa ggagctggcc atcgacgatg atgtggagtt ctggattcct 1320
acaattggca acacaaccta ccacgatagc tggaaggacg ccagcggatg gtcttttatc 1380
gcccagcaga aaagcaatct gatcaccacc atggaaaata ccaagttcgg cggcgtgggt 1440
acatctctga gcgacatcac aagcatggcc gagggcgagc tggccgccaa gctgaccagc 1500
ttcatgttcg gccacgtcgt gaacttcgtg atcatcctga tcgtgattct gttcctgtac 1560
tgcatgatca gaaaccggaa cagacaatac 1590
<210> 506
<211> 530
<212> PRT
<213> Alphabaculovirus Autographa californica nuclear polyhedrosis virus
<400> 506
Met Leu Leu Val Asn Gln Ser His Gln Gly Phe Asn Lys Glu His Thr
1 5 10 15
Ser Lys Met Val Ser Ala Ile Val Leu Tyr Val Leu Leu Ala Ala Ala
20 25 30
Ala His Ser Ala Phe Ala Ala Glu His Cys Asn Ala Gln Met Lys Thr
35 40 45
Gly Pro Tyr Lys Ile Lys Asn Leu Asp Ile Thr Pro Pro Lys Glu Thr
50 55 60
Leu Gln Lys Asp Val Glu Ile Thr Ile Val Glu Thr Asp Tyr Asn Glu
65 70 75 80
Asn Val Ile Ile Gly Tyr Lys Gly Tyr Tyr Gln Ala Tyr Ala Tyr Asn
85 90 95
Gly Gly Ser Leu Asp Pro Asn Thr Arg Val Glu Glu Thr Met Lys Thr
100 105 110
Leu Asn Val Gly Lys Glu Asp Leu Leu Met Trp Ser Ile Arg Gln Gln
115 120 125
Cys Glu Val Gly Glu Glu Leu Ile Asp Arg Trp Gly Ser Asp Ser Asp
130 135 140
Asp Cys Phe Arg Asp Asn Glu Gly Arg Gly Gln Trp Val Lys Gly Lys
145 150 155 160
Glu Leu Val Lys Arg Gln Asn Asn Asn His Phe Ala His His Thr Cys
165 170 175
Asn Lys Ser Trp Arg Cys Gly Ile Ser Thr Ser Lys Met Tyr Ser Arg
180 185 190
Leu Glu Cys Gln Asp Asp Thr Asp Glu Cys Gln Val Tyr Ile Leu Asp
195 200 205
Ala Glu Gly Asn Pro Ile Asn Val Thr Val Asp Thr Val Leu His Arg
210 215 220
Asp Gly Val Ser Met Ile Leu Lys Gln Lys Ser Thr Phe Thr Thr Arg
225 230 235 240
Gln Ile Lys Ala Ala Cys Leu Leu Ile Lys Asp Asp Lys Asn Asn Pro
245 250 255
Glu Ser Val Thr Arg Glu His Cys Leu Ile Asp Asn Asp Ile Tyr Asp
260 265 270
Leu Ser Lys Asn Thr Trp Asn Cys Lys Phe Asn Arg Cys Ile Lys Arg
275 280 285
Lys Val Glu His Arg Val Lys Lys Arg Pro Pro Thr Trp Arg His Asn
290 295 300
Val Arg Ala Lys Tyr Thr Glu Gly Asp Thr Ala Thr Lys Gly Asp Leu
305 310 315 320
Met His Ile Gln Glu Glu Leu Met Tyr Glu Asn Asp Leu Leu Lys Met
325 330 335
Asn Ile Glu Leu Met His Ala His Ile Asn Lys Leu Asn Asn Met Leu
340 345 350
His Asp Leu Ile Val Ser Val Ala Lys Val Asp Glu Arg Leu Ile Gly
355 360 365
Asn Leu Met Asn Asn Ser Val Ser Ser Thr Phe Leu Ser Asp Asp Thr
370 375 380
Phe Leu Leu Met Pro Cys Thr Asn Pro Pro Ala His Thr Ser Asn Cys
385 390 395 400
Tyr Asn Asn Ser Ile Tyr Lys Glu Gly Arg Trp Val Ala Asn Thr Asp
405 410 415
Ser Ser Gln Cys Ile Asp Phe Ser Asn Tyr Lys Glu Leu Ala Ile Asp
420 425 430
Asp Asp Val Glu Phe Trp Ile Pro Thr Ile Gly Asn Thr Thr Tyr His
435 440 445
Asp Ser Trp Lys Asp Ala Ser Gly Trp Ser Phe Ile Ala Gln Gln Lys
450 455 460
Ser Asn Leu Ile Thr Thr Met Glu Asn Thr Lys Phe Gly Gly Val Gly
465 470 475 480
Thr Ser Leu Ser Asp Ile Thr Ser Met Ala Glu Gly Glu Leu Ala Ala
485 490 495
Lys Leu Thr Ser Phe Met Phe Gly His Val Val Asn Phe Val Ile Ile
500 505 510
Leu Ile Val Ile Leu Phe Leu Tyr Cys Met Ile Arg Asn Arg Asn Arg
515 520 525
Gln Tyr
530
<210> 507
<211> 2955
<212> DNA
<213> Alphavirus Ross River Virus
<400> 507
atgtctgccg cgctgatgat gtgtatcctt gccaacacct ctttcccctg ctcatcacct 60
ccctgctacc cctgctgcta cgaaaaacag ccagaacaga cactgcggat gctggaagac 120
aatgtgaata gaccagggta ctatgagcta ctggaagcgt ccatgacatg cagaaacaga 180
tcacgccacc gccgtagtgt aacagagcac ttcaatgtgt ataaggctac tagaccgtac 240
ttagcgtatt gcgctgactg tggggacggg tacttctgct atagcccagt tgctatcgag 300
aagatccgag atgaggcgcc tgacggcatg ctcaagatcc aagtctccgc ccaaataggt 360
ctggacaagg caggtaccca cgcccacacg aagatccgat atatggctgg tcatgatgtt 420
caggaatcta agagagactc cttgagggtg tacacgtccg cagcgtgctc tatacatggg 480
acgatgggac acttcatcgt cgcacattgt ccgccaggcg actacctcaa ggtttcgttc 540
gaggacgcag attcacacgt gaaggcatgt aaggtccaat acaagcacga cccattgccg 600
gtgggtagag agaagttcgt ggttagaccc cactttggcg tagagctgcc atgcacctca 660
taccagctga caacagctcc caccgacgag gagatcgaca tgcacacacc gccagatata 720
ccggatcgca ccctgctatc acagacggcg ggcaacgtca aaataacagc aggcggcagg 780
actatcaggt acaattgtac ctgtggccgt gacaacgtag gcactaccag tactgacaag 840
accatcaaca catgcaagat tgaccaatgc catgctgccg ttaccagcca tgacaaatgg 900
caatttacct ctccatttgt tcccagggct gatcagacag ctaggagggg caaagtgcat 960
gttccattcc ctttgactaa cgtcacctgc cgagtgccgt tggctcgagc gccggatgtc 1020
acctatggta agaaggaggt gaccctgaga ttacacccag atcatccgac gctcttctcc 1080
tataggagtt taggagccga accgcacccg tacgaggagt gggttgacaa gttctctgag 1140
cgcatcatcc cagtgacgga agaagggatt gagtaccagt ggggcaacaa cccgccggtc 1200
cgcctatggg cgcaactgac gaccgagggc aaaccccatg gctggccaca tgaaatcatt 1260
cagtactatt atggactata ccccgccgcc accattgccg cagtatccgg ggcgagtctg 1320
atggccctcc taactctagc ggccacatgc tgcatgctgg ccaccgcgag gagaaagtgc 1380
ctaacaccat acgccttgac gccaggagcg gtggtaccgt tgacactggg gctgctttgc 1440
tgcgcaccga gggcgaacgc agcatcattc gctgagacta tggcatatct gtgggacgag 1500
aacaaaaccc tcttttggat ggaattcgcc gccccagccg cagcgcttgc tttgctggca 1560
tgctgtatca aaagcctgat ctgctgttgt aagccatttt cttttttagt gttactgagc 1620
ctgggagcct ccgcaaaagc ttacgagcac acagccacaa ttccgaatgt ggtggggttc 1680
ccgtataagg ctcacattga aaggaatggc ttctcgccca tgactctgca gcttgaagtg 1740
gtggagacaa gctgggaacc cacacttaac ctggagtaca ttacctgcga atacaagacg 1800
gtggtccctt cgccattcat caaatgttgc ggaacatcag aatgctcatc caaggagcag 1860
ccagactacc aatgcaaggt gtacacgggt gtatacccat tcatgtgggg tggagcctac 1920
tgtttctgcg actccgagaa cacgcagctc agcgaggcct atgtcgacag gtcagacgtt 1980
tgcaaacatg atcacgcatc ggcctacaag gcacacacgg cctctctaaa agcaacaatc 2040
aggatcagtt atggcaccat caaccagacc accgaggcct tcgttaatgg tgaacacgcg 2100
gtcaacgtgg gcggaagcaa gttcatcttt ggaccgatct caacagcttg gtcaccgttc 2160
gacaataaaa ttgtcgtgta taaagatgat gtctacaacc aggacttccc accctacgga 2220
tcaggccagc cgggtagatt cggagacatt cagagcagga cagtggagag caaagacttg 2280
tatgccaaca cggccctaaa actctcaaga ccatcacccg gggttgtgca tgtgccatac 2340
acgccgacac catccggatt taaatattgg ctgaaggaga aaggatcttc attgaataca 2400
aaggcccctt ttggctgcaa gataaagacc aatccagtca gagccatgga ttgtgcagtt 2460
ggcagtatac ctgtgtcgat ggacatacct gacagtgcat tcacacgagt ggtagatgcc 2520
ccggctgtaa cagacctgag ctgccaggta gtggtctgta cacactcctc cgatttcgga 2580
ggagttgcca cattgtctta caaaacggac aaacccggca agtgcgctgt ccactcacat 2640
tccaacgtcg caacgttgca agaggcgacg gtggatgtca aggaggatgg caaggtcaca 2700
gtgcactttt ccacggcgtc cgcctccccg gccttcaaag tgtccgtctg tgacgcaaaa 2760
acaacgtgca cggcggcgtg cgagcctcca aaagaccaca tcgtccctta tggggcgagc 2820
cataacaacc aggtctttcc ggacatgtca ggaactgcga tgacgtgggt gcagaggctg 2880
gccagtgggt taggtgggct ggctctcatc gcggtggttg tgctggtctt ggtaacctgc 2940
ataacaatgc gtcgg 2955
<210> 508
<211> 985
<212> PRT
<213> Alphavirus Ross River Virus
<400> 508
Met Ser Ala Ala Leu Met Met Cys Ile Leu Ala Asn Thr Ser Phe Pro
1 5 10 15
Cys Ser Ser Pro Pro Cys Tyr Pro Cys Cys Tyr Glu Lys Gln Pro Glu
20 25 30
Gln Thr Leu Arg Met Leu Glu Asp Asn Val Asn Arg Pro Gly Tyr Tyr
35 40 45
Glu Leu Leu Glu Ala Ser Met Thr Cys Arg Asn Arg Ser Arg His Arg
50 55 60
Arg Ser Val Thr Glu His Phe Asn Val Tyr Lys Ala Thr Arg Pro Tyr
65 70 75 80
Leu Ala Tyr Cys Ala Asp Cys Gly Asp Gly Tyr Phe Cys Tyr Ser Pro
85 90 95
Val Ala Ile Glu Lys Ile Arg Asp Glu Ala Pro Asp Gly Met Leu Lys
100 105 110
Ile Gln Val Ser Ala Gln Ile Gly Leu Asp Lys Ala Gly Thr His Ala
115 120 125
His Thr Lys Ile Arg Tyr Met Ala Gly His Asp Val Gln Glu Ser Lys
130 135 140
Arg Asp Ser Leu Arg Val Tyr Thr Ser Ala Ala Cys Ser Ile His Gly
145 150 155 160
Thr Met Gly His Phe Ile Val Ala His Cys Pro Pro Gly Asp Tyr Leu
165 170 175
Lys Val Ser Phe Glu Asp Ala Asp Ser His Val Lys Ala Cys Lys Val
180 185 190
Gln Tyr Lys His Asp Pro Leu Pro Val Gly Arg Glu Lys Phe Val Val
195 200 205
Arg Pro His Phe Gly Val Glu Leu Pro Cys Thr Ser Tyr Gln Leu Thr
210 215 220
Thr Ala Pro Thr Asp Glu Glu Ile Asp Met His Thr Pro Pro Asp Ile
225 230 235 240
Pro Asp Arg Thr Leu Leu Ser Gln Thr Ala Gly Asn Val Lys Ile Thr
245 250 255
Ala Gly Gly Arg Thr Ile Arg Tyr Asn Cys Thr Cys Gly Arg Asp Asn
260 265 270
Val Gly Thr Thr Ser Thr Asp Lys Thr Ile Asn Thr Cys Lys Ile Asp
275 280 285
Gln Cys His Ala Ala Val Thr Ser His Asp Lys Trp Gln Phe Thr Ser
290 295 300
Pro Phe Val Pro Arg Ala Asp Gln Thr Ala Arg Arg Gly Lys Val His
305 310 315 320
Val Pro Phe Pro Leu Thr Asn Val Thr Cys Arg Val Pro Leu Ala Arg
325 330 335
Ala Pro Asp Val Thr Tyr Gly Lys Lys Glu Val Thr Leu Arg Leu His
340 345 350
Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Ser Leu Gly Ala Glu Pro
355 360 365
His Pro Tyr Glu Glu Trp Val Asp Lys Phe Ser Glu Arg Ile Ile Pro
370 375 380
Val Thr Glu Glu Gly Ile Glu Tyr Gln Trp Gly Asn Asn Pro Pro Val
385 390 395 400
Arg Leu Trp Ala Gln Leu Thr Thr Glu Gly Lys Pro His Gly Trp Pro
405 410 415
His Glu Ile Ile Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala Thr Ile
420 425 430
Ala Ala Val Ser Gly Ala Ser Leu Met Ala Leu Leu Thr Leu Ala Ala
435 440 445
Thr Cys Cys Met Leu Ala Thr Ala Arg Arg Lys Cys Leu Thr Pro Tyr
450 455 460
Ala Leu Thr Pro Gly Ala Val Val Pro Leu Thr Leu Gly Leu Leu Cys
465 470 475 480
Cys Ala Pro Arg Ala Asn Ala Ala Ser Phe Ala Glu Thr Met Ala Tyr
485 490 495
Leu Trp Asp Glu Asn Lys Thr Leu Phe Trp Met Glu Phe Ala Ala Pro
500 505 510
Ala Ala Ala Leu Ala Leu Leu Ala Cys Cys Ile Lys Ser Leu Ile Cys
515 520 525
Cys Cys Lys Pro Phe Ser Phe Leu Val Leu Leu Ser Leu Gly Ala Ser
530 535 540
Ala Lys Ala Tyr Glu His Thr Ala Thr Ile Pro Asn Val Val Gly Phe
545 550 555 560
Pro Tyr Lys Ala His Ile Glu Arg Asn Gly Phe Ser Pro Met Thr Leu
565 570 575
Gln Leu Glu Val Val Glu Thr Ser Trp Glu Pro Thr Leu Asn Leu Glu
580 585 590
Tyr Ile Thr Cys Glu Tyr Lys Thr Val Val Pro Ser Pro Phe Ile Lys
595 600 605
Cys Cys Gly Thr Ser Glu Cys Ser Ser Lys Glu Gln Pro Asp Tyr Gln
610 615 620
Cys Lys Val Tyr Thr Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr
625 630 635 640
Cys Phe Cys Asp Ser Glu Asn Thr Gln Leu Ser Glu Ala Tyr Val Asp
645 650 655
Arg Ser Asp Val Cys Lys His Asp His Ala Ser Ala Tyr Lys Ala His
660 665 670
Thr Ala Ser Leu Lys Ala Thr Ile Arg Ile Ser Tyr Gly Thr Ile Asn
675 680 685
Gln Thr Thr Glu Ala Phe Val Asn Gly Glu His Ala Val Asn Val Gly
690 695 700
Gly Ser Lys Phe Ile Phe Gly Pro Ile Ser Thr Ala Trp Ser Pro Phe
705 710 715 720
Asp Asn Lys Ile Val Val Tyr Lys Asp Asp Val Tyr Asn Gln Asp Phe
725 730 735
Pro Pro Tyr Gly Ser Gly Gln Pro Gly Arg Phe Gly Asp Ile Gln Ser
740 745 750
Arg Thr Val Glu Ser Lys Asp Leu Tyr Ala Asn Thr Ala Leu Lys Leu
755 760 765
Ser Arg Pro Ser Pro Gly Val Val His Val Pro Tyr Thr Pro Thr Pro
770 775 780
Ser Gly Phe Lys Tyr Trp Leu Lys Glu Lys Gly Ser Ser Leu Asn Thr
785 790 795 800
Lys Ala Pro Phe Gly Cys Lys Ile Lys Thr Asn Pro Val Arg Ala Met
805 810 815
Asp Cys Ala Val Gly Ser Ile Pro Val Ser Met Asp Ile Pro Asp Ser
820 825 830
Ala Phe Thr Arg Val Val Asp Ala Pro Ala Val Thr Asp Leu Ser Cys
835 840 845
Gln Val Val Val Cys Thr His Ser Ser Asp Phe Gly Gly Val Ala Thr
850 855 860
Leu Ser Tyr Lys Thr Asp Lys Pro Gly Lys Cys Ala Val His Ser His
865 870 875 880
Ser Asn Val Ala Thr Leu Gln Glu Ala Thr Val Asp Val Lys Glu Asp
885 890 895
Gly Lys Val Thr Val His Phe Ser Thr Ala Ser Ala Ser Pro Ala Phe
900 905 910
Lys Val Ser Val Cys Asp Ala Lys Thr Thr Cys Thr Ala Ala Cys Glu
915 920 925
Pro Pro Lys Asp His Ile Val Pro Tyr Gly Ala Ser His Asn Asn Gln
930 935 940
Val Phe Pro Asp Met Ser Gly Thr Ala Met Thr Trp Val Gln Arg Leu
945 950 955 960
Ala Ser Gly Leu Gly Gly Leu Ala Leu Ile Ala Val Val Val Leu Val
965 970 975
Leu Val Thr Cys Ile Thr Met Arg Arg
980 985
<210> 509
<211> 1575
<212> DNA
<213> Artificial Sequence
<220>
<223> codon optimized rabies virus glycoprotein
<400> 509
atggtgcccc aggccctgct cttcgtgcct ctgctcgtct ttccactgtg cttcggcaaa 60
tttcccatct acactattcc tgacaagctg ggaccctgga gtcctatcga tattcaccat 120
ctgtcatgcc ctaacaatct cgtggtcgag gatgaagggt gtaccaacct gtcaggtttc 180
agctacatgg agctgaaagt ggggtatatc ctcgctatta aggtcaacgg cttcacatgc 240
actggagtgg tcaccgaggc agaaacctac acaaattttg tgggctatgt caccacaact 300
ttcaagagga aacactttag accaacaccc gacgcctgtc gcgccgctta caactggaag 360
atggctggcg atccacgata tgaggaatct ctgcacaatc cttacccaga ctatagatgg 420
ctgcggacag tgaagaccac aaaagagagc ctggtcatca ttagcccatc cgtcgcagac 480
ctggatccct acgatagatc cctgcactct cgggtgtttc cctctggcaa gtgcagtgga 540
gtggccgtca gctccactta ctgtagcacc aaccatgatt atactatctg gatgccagag 600
aatccccggc tgggaatgtc ctgcgacatt ttcacatcta gtcgcgggaa gcgagccagt 660
aaagggtcag agacttgtgg ttttgtggac gaaaggggcc tgtataagag cctcaaagga 720
gcttgcaagc tgaaactctg tggcgtgctg ggactcagac tgatggatgg aacctgggtc 780
tcaatgcaga caagcaacga gactaagtgg tgcccccctg acaaactcgt gaatctgcac 840
gacttcaggt ccgatgagat cgaacatctg gtggtcgagg aactcgtgcg aaaaagggag 900
gaatgtctcg atgctctgga gtctatcatg actaccaagt ctgtgagttt taggagactc 960
agtcacctga gaaagctcgt ccctggcttc ggaaaagcat acaccatctt taacaagaca 1020
ctgatggaag cagacgccca ttataaaagc gtggagacct ggaatgaaat cctgccatcc 1080
aagggatgcc tccgagtcgg aggacgctgt caccctcatg tgaacggcgt cttctttaat 1140
ggaatcattc tggggcctga cggtaacgtg ctgatcccag agatgcagtc aagcctgctc 1200
cagcagcaca tggagctgct cgaatcctct gtgattcctc tggtccatcc actcgcagat 1260
ccctctacag tgttcaagga cggggatgag gccgaagact ttgtggaggt ccacctgcca 1320
gatgtgcata accaggtgtc tggggtcgac ctcggtctgc ccaattgggg gaagtacgtg 1380
ctgctcagcg ccggtgcact gactgctctc atgctgatca ttttcctgat gacctgctgt 1440
cgacgagtga accggtccga gcctactcag cacaatctgc gagggaccgg tagagaagtg 1500
tccgtcacac cacagtctgg caaaatcatt agttcatggg agagccataa gtccgggggt 1560
gaaacacgcc tgtga 1575
<210> 510
<211> 524
<212> PRT
<213> Lyssavirus Rabies Virus
<400> 510
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys
195 200 205
Asp Ile Phe Thr Ser Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ser Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Lys Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Glu
340 345 350
Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr
485 490 495
Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser
500 505 510
Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 511
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain Nishigahara RCEH
<400> 511
acgtgagatc gccaccatgg tgcctcaggc tctgctgctg gtccctatcc tgggattcag 60
ctcctgcttc ggcaagttcc ccatctacac catccctgac accctgggcc cttggtcccc 120
aatcgacatc caccacctga gctgccccaa caacctggtc gtggaggatg aaggctgtac 180
caatctgagc ggcttcagct acatggaact gaaggtggga tatatcagcg ccatcaaggt 240
gaatggcttc acctgcaccg gcgtggtgac cgaggccgag acatacacaa acttcgtggg 300
ctacgtgacc acaaccttca agcggaagca cttcagacct acaccagacg cctgtagagc 360
cgcctacaac tggaagatgg ccggagatcc cagatacgag gaatctctgc acagccccta 420
ccccgactac cactggctga gaaccgtgaa gacaaccaag gaatccctgg tgattatcag 480
ccctagcgtg gccgacctgg acccttacga caacagccta catagcagag tgtttccttc 540
tggcaagtgt agcggcatca ccgtgtccag cgtgtactgc agcaccaacc acgactacac 600
cgtttggatg cctgagagcc tgcggctggg gaccagctgc gacattttta ctaatagcag 660
aggaaaacgg gcttctaaag gatctaaaac ctgtggcttt gtggacgaga gaggcctgta 720
caaatctctg aaaggcgcct gcaagctgaa gctgtgcggc gttctgggcc tcagactgat 780
ggacggcacc tgggttgcta tgcaaacaag caacgagaca aagtggtgtc ctcctgacca 840
gttggtgaac ctgcacgatc tgcggtctga tgagatcgag cacctggtga tcgaggaact 900
ggtcaagaag cgcgaggaat gcctggatgc cctggaaagc atcattacaa ccaaatcagt 960
gtcttttaga cggctgtcct acctgcggaa gctggtgccc ggcttcggca aggcctatac 1020
aatctttaac aagaccctga tggaagcaga agcccactac aagagcgtgc ggacctggaa 1080
cgaaatcatc cctagcaagg gctgcctgag ggtggggggc agatgccacc ctcacgtgaa 1140
cggcgtgttc ttcaacggca tcatcctggg ccctgacggc cacgtgctga tccctgagat 1200
gcagagctct ctgctgcagc agcacatcga gctgctcgag agctctgtga tcccactgat 1260
gcaccccctg gccgatcctt tcaccgtttt caaggacggc gacgaaacag aagatttcat 1320
cgaggtgcat ctgcccgacg tgcacgagca ggtgtctgga gtggacctgg gcctgcctaa 1380
ttggggcgaa tacgtgctgc tgagcgctgg cacccttatc gccctcatgc tgatcatctt 1440
cctgatgacc tgctgcagaa aggtggatag accagagagc acccagcgga gcctgagagg 1500
caccggaaga aacgtgtccg tgacaagcca gagcggcaag ttcatcccca gctgggagtc 1560
ttataagagc ggaggcgaga caggcctgtg aattcacccc accagtg 1607
<210> 512
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain Nishigahara RCEH
<400> 512
Met Val Pro Gln Ala Leu Leu Leu Val Pro Ile Leu Gly Phe Ser Ser
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Thr Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Ser Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Asn Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Ile Thr Val Ser Ser Val Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Val Trp Met Pro Glu Ser Leu Arg Leu Gly Thr Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Leu Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Ile Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Ile Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser Tyr Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Glu Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Ile Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Phe Thr Val Phe Lys Asp Gly Asp Glu Thr Glu
420 425 430
Asp Phe Ile Glu Val His Leu Pro Asp Val His Glu Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Glu Tyr Val Leu Leu Ser Ala
450 455 460
Gly Thr Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Lys Val Asp Arg Pro Glu Ser Thr Gln Arg Ser Leu Arg Gly Thr
485 490 495
Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Phe Ile Pro Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Gly Leu
515 520
<210> 513
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain India
<400> 513
acgtgagatc gccaccatgg ttcctcaggt gctgctcttc gtgcctctgc tggtcttttc 60
catgtgcttc ggcaaattcc ccatctacac catcccagac aagctgggcc cttggagccc 120
tatcgacatc caccacctga gctgccctaa caacctcgtg gtggaagatg agggctgtac 180
aaacctgtct ggcttttctt atatggagct gaaagtggga tacatcagcg ccatcaaggt 240
gaacggcttc acctgcaccg gcgtggtgac agaggccgag acatacacca acttcgtggg 300
ctacgtgaca accaccttca agagaaagca cttccggcct acccctgacg cctgcagagc 360
cgcttacaac tggaagatgg ccggcgatcc tagatacgag gaaagcctgc ataatcctta 420
tcctgactac cactggctga gaacagtgaa aaccaccaag gaatccctgg tgatcatcag 480
cccctctgta gccgatctgg acccctacga caagagcctg cacagcagag tgttccctag 540
cggaaaatgc agcggtatca ccatctctag cacatactgc agcaccaacc acgactacac 600
gatctggatg cccgagaacc ccagactggg cacctcctgc gacattttta caaatagccg 660
gggcaagcgg gccagcaagg gcggcaagac atgcggcttc gtggacgaga gaggcctgta 720
caaaagcctg aagggcgcct gtaaactgaa gctgtgcgga gtgcttggcc tgcgactgat 780
ggacggcaca tgggtggcca tgcaaacaag cgatgaaacc aagtggtgcc cacctgacca 840
gctggtgaac ctgcatgatt tcagaagcga cgaaatcgag cacctggtgg tcgaggaact 900
ggtgaagaag cgggaggagt gcctggatgc cctggaaagc atcatggcta caaagagcgt 960
gtcatttcgc agactgagcc acctgcggaa gctggtgcct ggcttcggca aagcctacac 1020
catcttcaac aagaccctga tggaagctga tgcccactac aagtctgtgc ggacctggaa 1080
cgagatcatt cccagcaagg gatgtctgag agtgggcgga aggtgccacc cccacgtgaa 1140
tggcgtgttc ttcaacggca tcatcctggg ccccgacggc cacgtgctga tcccagagat 1200
gcagagcagc ctgctgcagc agcacatgga actgctggaa tctagcgtga tccctctgat 1260
gcaccccctg gccgaccctt ctaccgtgtt taaggacgga gatgaggctg aggacttcgt 1320
ggaagtgcat ctccctgacg tgcacaagca gatctctggc gttgatctgg gactgcctag 1380
ctggggcaag tacgtgctgg tgtccgcagg cgtgctggtg gtcctgatgc tgaccatttt 1440
catcatgacc tgttgtggca gagtgcacag acccaagtcc acccagcacg gcctgggcgg 1500
aaccggcaga aaggtgtccg tcaccagcca gtctggcaaa gtaatcagca gctgggagag 1560
ctacaagagt ggaggcgaga caagactgtg aattcacccc accagtg 1607
<210> 514
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain India
<400> 514
Met Val Pro Gln Val Leu Leu Phe Val Pro Leu Leu Val Phe Ser Met
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Ile Thr Ile Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Thr Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Gly Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Ala Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Ile Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Ser Trp Gly Lys Tyr Val Leu Val Ser Ala
450 455 460
Gly Val Leu Val Val Leu Met Leu Thr Ile Phe Ile Met Thr Cys Cys
465 470 475 480
Gly Arg Val His Arg Pro Lys Ser Thr Gln His Gly Leu Gly Gly Thr
485 490 495
Gly Arg Lys Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Ser Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 515
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain CVS-11
<400> 515
acgtgagatc gccaccatgg tgcctcaggt gctgctgttc gtgccactgc tgggatttag 60
cctgtgcttc ggaaaattcc caatctacac catccccgat aagctggggc cttggagccc 120
tatcgacatc caccacctgt catgccccaa caacctggtg gtggaagatg agggctgcac 180
caacctgagc gagttcagct acatggaact gaaagtgggc tacatcagcg ccatcaaggt 240
gaatggcttc acctgcaccg gagtagtgac cgaggccgaa acctacacaa acttcgtggg 300
ctacgtcaca accacattca agagaaagca cttccggccc acccctgatg cttgtagagc 360
cgcttacaac tggaagatgg ccggcgaccc tcggtacgag gaaagcctgc acaaccctta 420
tcctgactac cactggctga gaacagtgag aaccaccaaa gagtctctca tcattatcag 480
ccctagcgtg acagacctgg atccttacga caagtccctc cattctcggg tgtttccagg 540
cggaaagtgc agcggcatca ccgtgagctc tacctactgc agcaccaacc acgactatac 600
aatctggatg cccgagaacc ccagacccag aacaccgtgc gacatcttca ccaacagcag 660
agggaaaaga gccagcaaag gcaacaaaac ctgtggcttc gtggacgaaa gaggcctgta 720
taagtccctg aagggagcct gcagactgaa gctgtgcggc gtgctgggcc ttagactgat 780
ggacggcacc tgggtggcca tgcagacaag cgacgagaca aagtggtgtc ctcctgacca 840
gctggtcaac ctgcatgatt tccgcagtga cgagatcgag cacctggtcg tggaagagct 900
ggttaagaag cgggaagagt gtctggacgc cctggaaagc atcatgacca ccaagagcgt 960
gtccttccgg agactgagcc acctgagaaa gctggtgccc ggctttggca aggcctacac 1020
catctttaac aagaccctga tggaagccga cgcccactac aagagcgtgc ggacctggaa 1080
cgagatcatt cccagcaagg gctgtctgaa agtgggaggc cggtgccacc ctcacgtgaa 1140
tggcgtcttt ttcaacggca tcatcctggg ccctgacggc cacgtgctga ttcctgagat 1200
gcaatctagc ctcctgcagc agcacatgga actgctgaag tctagcgtga tccctctgat 1260
gcaccccctg gccgatcctt ctaccgtgtt caaggaaggc gatgaggccg aggacttcgt 1320
cgaggtgcac cttcctgacg tgtacaagca gatctccggc gtggatctgg gactgcctaa 1380
ttggggcaag tacgtgctga tgacagccgg agctatgatc ggcctggtgc tgatcttctc 1440
cctgatgacc tggtgcagac gggctaatag acctgagtcc aaacagagaa gcttcggcgg 1500
cacaggcagg aacgtgtctg tgacatctca gagcggcaag gtgatcccaa gctgggagag 1560
ttacaagagc ggcggagaaa tcagactgtg aattcacccc accagtg 1607
<210> 516
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain CVS-11
<400> 516
Met Val Pro Gln Val Leu Leu Phe Val Pro Leu Leu Gly Phe Ser Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Gly
165 170 175
Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Arg Thr Pro Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Asn Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Lys Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala
450 455 460
Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys
465 470 475 480
Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr
485 490 495
Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Ile Arg Leu
515 520
<210> 517
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain ERA
<400> 517
acgtgagatc gccaccatgg tgcctcaggc cctgttgttt gtgccactcc tggtgttccc 60
actgtgcttc ggcaaattcc ctatctacac catcctggat aagctgggcc catggagccc 120
catcgacatc caccacctgt cttgtcctaa caacctggtg gtcgaggatg agggctgcac 180
caatctgagc ggcttcagct acatggagct gaaggtgggc tacatcctgg ccatcaagat 240
gaacggcttc acctgtacag gagtggtgac cgaggccgag acttatacaa acttcgtggg 300
ctacgtgaca acaaccttca agcggaagca cttcagacct acacctgatg cctgtagagc 360
cgcttacaac tggaaaatgg ccggcgatcc aagatacgag gaatctctcc ataatcctta 420
tcctgattac agatggctgc gcaccgtgaa gaccaccaaa gagtccctgg tcatcatctc 480
ccctagcgtg gccgacctgg acccttacga ccggagcctg cacagcagag tgttcccttc 540
cggcaagtgc agcggcgtgg ccgtgagctc cacctactgc tctacaaacc acgactacac 600
catctggatg cctgaaaacc ccagactggg aatgagctgc gacatcttca caaacagccg 660
gggcaagcgg gcctctaagg gcagcgagac ctgcggattt gtggacgaaa gaggcctgta 720
caagagcctc aaaggcgcct gcaagctgaa gctgtgtggc gtgctgggtc tcagactgat 780
ggacggcaca tgggtggcca tgcagaccag caacgagacc aaatggtgcc cccccgacca 840
gctggtgaac ctgcacgact tccggagcga cgagatcgag cacctggtgg tggaagaact 900
ggttagaaag cgggaagagt gcctggacgc tctggaaagc atcatgacca ccaagagcgt 960
ttcttttcgg cggctgagcc acctgagaaa actggtgccc ggcttcggaa aggcctacac 1020
catcttcaac aagacactga tggaagctga tgcccactac aagtctgtga ggacatggaa 1080
cgagattctg cctagcaagg gatgtctgag agtgggcgga agatgccacc cccacgtgaa 1140
tggcgtgttt ttcaacggca tcatcctggg ccctgatggc aacgtgctga tccctgagat 1200
gcaaagcagc ctgctgcagc agcatatgga actgctggaa agctctgtta tccccctggt 1260
gcatcctctg gctgacccca gtaccgtgtt caaggacggc gacgaggctg aggacttcgt 1320
ggaagtgcac ctgcccgatg ttcacaacca ggtgtccggc gtcgacctgg gcctgcctaa 1380
ttggggcaag tacgtgctgc tgagcgccgg cgccctgacc gccctgatgc tgatcatctt 1440
cctgatgaca tgctgcagaa gggttaacag aagcgagcct acccagcaca acctgcgcgg 1500
gaccggcaga gaggtgtctg tgacacctca gtctggaaag atcattagca gctgggagtc 1560
ccacaagagc ggaggagaaa ccagactgtg aattcacccc accagtg 1607
<210> 518
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain ERA
<400> 518
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Leu Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Met Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr
485 490 495
Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser
500 505 510
Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 519
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain SAD B19
<400> 519
acgtgagatc gccaccatgg tgccccaggc ccttctgttc gtgcctctgc tggtctttcc 60
tctgtgtttc ggcaagttcc ccatctacac aatccctgat aagctgggcc cttggtcccc 120
tatcgacatc caccacctgt cttgccctaa caacctggtc gtggaagatg agggctgtac 180
aaatctgagc ggcttcagct acatggaact caaagtgggc tacatcctgg ctatcaaggt 240
gaacggattt acctgtaccg gcgtggtgac cgaggctgaa acctacacca acttcgtggg 300
atatgtgaca accacattca agcggaagca cttccggcct accccagacg cctgcagagc 360
cgcttataac tggaagatgg ccggagatcc tagatacgag gaaagcctgc acaaccctta 420
ccccgattac agatggctgc gcaccgtgaa gaccacaaag gaaagcctgg tgatcatttc 480
tccttctgtc gccgatctgg acccttacga cagaagcctg cacagcagag tgtttcctag 540
cggcaaatgc agcggcgtgg ccgtgagcag tacatactgc agcaccaacc acgactacac 600
catttggatg ccagagaacc ccagactggg catgagctgc gacatcttca ccaacagccg 660
gggaaaacgg gcctctaagg gcagcgagac atgtggcttc gttgacgaga gaggcctgta 720
caagtcactg aagggcgcct gcaagctgaa gctgtgcggc gtcctgggcc taagactgat 780
ggacggcacc tgggtgtcca tgcaaacaag caacgagacc aagtggtgcc cccccgacaa 840
gctggtgaat ctccatgatt tcaggtctga tgagatcgag cacctggtgg tcgaggaact 900
ggtgcggaaa agagaagagt gcctggatgc tcttgagagc atcatgacaa ccaagagcgt 960
gtccttcaga cggctgagcc acctgagaaa gctggttcct ggcttcggca aagcctacac 1020
catcttcaac aagaccctga tggaggccga cgcccactac aagtccgtgc ggacctggaa 1080
cgagatcctg ccaagcaagg gatgtctgcg ggtgggcggc agatgccacc cccacgtgaa 1140
cggcgttttc ttcaacggca tcatcctggg tcctgacgga aatgtgctga tccccgagat 1200
gcagagcagc ctgctgcagc agcacatgga actgctggaa tcttctgtga tcccactggt 1260
gcatcctctg gccgacccta gcacagtgtt taaggacggc gacgaggccg aggacttcgt 1320
ggaagtgcac ctgcccgacg tgcacaacca ggtgagcggc gtggacctgg gtctgcctaa 1380
ttggggcaaa tacgtactgc tgagcgccgg cgctctgacc gccctgatgc tgatcatctt 1440
tctgatgacc tgctgccgga gagtgaacag aagcgagccc acccagcaca atctgagggg 1500
cacaggaaga gaggtgtccg tgacccctca gagcggcaag atcatcagct cttgggaaag 1560
ccacaagagc ggcggagaaa ccagactgtg aattcacccc accagtg 1607
<210> 520
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain SAD B19
<400> 520
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Arg Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ser Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Lys Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr
485 490 495
Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser
500 505 510
Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 521
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain Vnukovo-32
<400> 521
acgtgagatc gccaccatgg tgccccaggc cctgcttttc gtgccactgc tggtgttccc 60
tctgtgcttc ggcaagttcc ccatctacac aatccctgat aagctgggcc cttggtcccc 120
tatcgacatc caccacctga gctgtcctaa caacctggtg gtggaggacg agggctgcac 180
aaatctgagc ggcttcagct acatggagct gaaggtgggc tacatcctgg ctatcaagat 240
gaacggattc acctgcaccg gagtggtgac cgaggctgaa aactacacca atttcgtggg 300
ctacgtcacc acgacattca aaagaaagca cctgcggccc acacctgacg cctgtagggc 360
cgcttacaac tggaaaatgg ccggcgaccc tagatacgag gaatccctgc acaaccccta 420
tcctgattac agctggctga ggaccgtgaa gaccaccaag gaaagcctcg tcatcatcag 480
ccctagcgtg gccgatctgg atccttacga cagaagcctc cattctcggg tgtttccaag 540
cggcaagtgc agcggcgttg ccgtgtctag cacctactgc agcaccaacc acgattacac 600
catctggatg cctgagaacc ctagactggg caaaagctgc gacatcttca caaatagcag 660
aggaaaacgg gcctctaagg gcagcgaaac ctgtggcttt gtggacgaga gaggcctgta 720
caagagcctg aaaggcgcct gcaagctgaa actctgcggc gtgctgggcc tgagactgat 780
ggacggcacc tgggtggcca tgcaaaccag caacgagaca aagtggtgcc cacctgacca 840
gctggtgaac ctgcacgact tccggagcga cgagatcgag cacctggtag tggaagagct 900
ggtgcggaag cgggaagagt gcctggacgc tctggaaagc atcatgacca ccaagtccgt 960
gtcttttaga cggctgtccc acctgcggaa gctggtcccc ggcttcggca aggcctatac 1020
catctttaac aagaccctga tggaagccga cgcccactac aagtccgtca gaacctggaa 1080
cgagatcctg cctagcaagg gatgtctgag agtgggcgga agatgccacc cccacgtgaa 1140
cggcgtgttc ttcaacggca tcatcctggg ccccgatggc aacgtgctga tccccgagat 1200
gcagagcagc cttctccagc agcacatgga actgctggaa agctctgtta ttccactggt 1260
gcaccctctg gccgaccctt ctacagtgtt caaggacggc gatgaggccg aggacttcgt 1320
ggaagtgcat ctgcctgatg tgcacaacca ggtgtccgga gtggacctgg gcctgcccaa 1380
ctggggaaaa tacgtgctgc tgagcgccgg agccctgacc gccctgatgc tgatcatttt 1440
cctgatgacc tgttgcagaa gagtgaatag aagcgagcct acacagcaca atctgcgcgg 1500
aacaggcaga gaagtcagcg tgacacctca gacctggaag atcatctcta gttgggagag 1560
tcacaagtct ggcggcgaga caagactgtg aattcacccc accagtg 1607
<210> 522
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain Vnukovo-32
<400> 522
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Leu Ala Ile Lys Met Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Asn Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Leu Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr Ser Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Lys Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Arg Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Leu Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Val His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Asn Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr
485 490 495
Gly Arg Glu Val Ser Val Thr Pro Gln Thr Trp Lys Ile Ile Ser Ser
500 505 510
Trp Glu Ser His Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 523
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain Pasteur vaccins / PV
<400> 523
acgtgagatc gccaccatgg tcccccaggc cctgctgttc gtgccactgc tggtgtttcc 60
tctctgcttc ggaaaattcc ctatctacac catccccgat aagctgggcc catggagccc 120
catcgacatc caccacctga gctgccccaa caacctggtg gtggaggacg agggctgtac 180
caacctgtcc ggctttagct acatggaact gaaggtgggc tacatcagcg ccatcaagat 240
gaacggcttc acatgtacag gcgtggtgac cgaggctgaa acttatacca acttcgtggg 300
ctatgtgaca accacattca agagaaagca cttccgcccc acccctgatg catgtagagc 360
cgcttacaac tggaagatgg ccggcgaccc tagatacgag gaaagcctgc ataatcctta 420
ccccgactac cactggctga gaacagtgaa gaccaccaag gaatctctgg ttatcatctc 480
accttctgtg gctgacctgg acccctacga cagatccctg cacagcagag tgttccctgg 540
cggcaattgc agcggcgtgg ccgtgtcttc tacatactgc agcacaaacc acgactacac 600
catctggatg cctgagaacc ccagactggg catgagctgc gacatcttca ccaatagccg 660
gggcaagcgg gccagcaagg gcagcgagac ctgtggcttc gtggacgaga gaggcctgta 720
caagagcctg aagggagcct gtaaactgaa gctgtgcggc gtgctgggcc tgcggctgat 780
ggacggcacc tgggtggcca tgcagaccag caacgaaacc aagtggtgcc cacctggaca 840
gctggtgaac ctccatgatt ttcggagcga tgagatcgag caccttgtgg tcgaggaact 900
ggtgaaaaag cgggaagagt gcctggatgc cctggaaagc atcatgacca ccaaaagcgt 960
gtccttcaga agactgtctc acctgagaaa gttggtgcct ggctttggga aggcctacac 1020
catctttaac aagaccctga tggaagccga cgcccactac aagagcgtga ggacctggaa 1080
cgagatcatt ccaagcaagg gctgcctgag agtgggcggt agatgccacc ctcacgtgaa 1140
cggcgtgttc ttcaacggca tcatcctggg ccctgatggc aacgtgctga tccctgagat 1200
gcaatctagc ctgctgcagc agcacatgga actcctggtg tccagcgtga tccctctcat 1260
gcaccccctg gccgatcctt ccacagtgtt caagaacggc gatgaagctg aggacttcgt 1320
tgaggtgcac ctgcctgacg tgcacgagcg gatcagcgga gtggacctgg gactgcctaa 1380
ttggggcaaa tacgtgctgc tgagcgccgg cgccctgacc gccctgatgc tgatcatctt 1440
cctgatgaca tgctggcgga gagtgaatag aagcgagcct acccagcaca acctgcgggg 1500
caccggaaga gaagtgtccg ttacacctca gagcggcaag atcattagca gctgggagtc 1560
ctacaaatct ggcggagaga caggactgtg aattcacccc accagtg 1607
<210> 524
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain Pasteur vaccins / PV
<400> 524
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Met Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Arg Ser Leu His Ser Arg Val Phe Pro Gly Gly
165 170 175
Asn Cys Ser Gly Val Ala Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Gly Met Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Glu
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Gly Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Val Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asn Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Glu Arg Ile Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Ala Leu Thr Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Trp
465 470 475 480
Arg Arg Val Asn Arg Ser Glu Pro Thr Gln His Asn Leu Arg Gly Thr
485 490 495
Gly Arg Glu Val Ser Val Thr Pro Gln Ser Gly Lys Ile Ile Ser Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Gly Leu
515 520
<210> 525
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain PM1503/AVO1
<400> 525
acgtgagatc gccaccatgg tgcctcaggt gcttctgttc gtgcccctgc tgggcttcag 60
cctgtgcttc ggaaagttcc ctatctacac catccctgat gagctgggac cttggtcccc 120
aatcgacatc caccacctca gctgccctaa caacctggtg gtggaagatg agggctgcac 180
caacctgagc gagttcagct acatggagct gaaggtggga tacatctccg ccatcaaggt 240
gaacggcttt acctgtaccg gcgtggtgac agaagctgaa acctacacaa atttcgtggg 300
ctacgtgaca acaaccttca agagaaagca cttccggccc acccctgacg cttgccgggc 360
tgcttataac tggaagatgg ccggtgaccc cagatacgag gaatccctgc acaaccctta 420
tcctgattac cactggctga ggaccgtgcg gaccaccaaa gagtccctga tcattatcag 480
ccctagcgtg accgacctgg acccttacga caagagcctg cattctagag gctttccagg 540
tggcaagtgc agcggcatca cagtgtctag cacctactgc agcaccaacc acgactacac 600
catctggatg cctgagaacc ccggccctag aaccccgtgc gacatcttca ccaacagcag 660
aggcaaaagg gccagcaagg gcaacaagac atgcggcttc gtggatgaga gaggcctgta 720
caagtccctg aagggcgcct gtcggctgaa gctctgtggc gtgctgggac tgcggttgat 780
ggacggcaca tgggtcgcca tgcaaacatc tgatgagaca aagtggtgcc cccccgacca 840
gctggtcaac ctgcacgatt tcagatctga cgagatcgag cacctggtgg ttgaggaact 900
ggtgaagaaa cgggaagagt gcctggacgc cctggaatcc atcatgacaa caaagagcgt 960
ctccttccgc agactgagcc acctgagaaa gctggtgcct ggctttggca aggcctacac 1020
catctttaac aagacactga tggaagccga cgcccactac aagtctgtgc gaacctggaa 1080
cgagattatc cccagcaaag gctgtctgaa agttggaggc agatgccacc cccacgtgaa 1140
tggagtcttt ttcaacggca tcatcctggg ccctgacggc cacgtgctga tccccgagat 1200
gcagtctagc ctgctgcagc agcacatgga actgctgaag agcagcgtca tcccactgat 1260
gcaccctctg gccgaccctt caacagtgtt caaggaagga gatgaagccg aggacttcgt 1320
ggaagtgcat ctgcctgatg tgtacaaaca gatcagcggc gtggacctgg gcctgccaaa 1380
ttggggcaag tacgtgctga tgaccgccgg cgccatgatc ggcctggtgc tgatcttcag 1440
cctgatgacc tggtgtagaa gagccaatag acctgagtct aagcagagaa gcttcggcgg 1500
caccggacgg aacgtgtccg tgaccagcca gagcgggaaa gtgatcccta gctgggaatc 1560
atatagaagc ggcggcgaga tccggctgtg aattcacccc accagtg 1607
<210> 526
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain PM1503/AVO1
<400> 526
Met Val Pro Gln Val Leu Leu Phe Val Pro Leu Leu Gly Phe Ser Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Glu Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Gly Phe Pro Gly Gly
165 170 175
Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Gly Pro Arg Thr Pro Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Asn Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Lys Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala
450 455 460
Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys
465 470 475 480
Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr
485 490 495
Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser
500 505 510
Trp Glu Ser Tyr Arg Ser Gly Gly Glu Ile Arg Leu
515 520
<210> 527
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain China/DRV
<400> 527
acgtgagatc gccaccatgg tgccccaagc cctgctgctg gtgcctctgc tgggcttttc 60
cctgtgcttc ggcaagttcc ccatctacac catccccacc aaactgggac cttggagccc 120
tatcgacatc caccacctga gctgccccaa caacctggtg gtggaggatg agggatgcac 180
aaacctgagc ggcttcagct acatggaact gaaggtggga agaatcagcg ccatcaaggt 240
caacggcttc acctgtacag gcgtggtgac cgaggctgaa acatacacaa atttcgtggg 300
atacgtgacc accactttta agagaaagca cttcagacct atgcccggct gcatgtacag 360
ccgggtgcag ctggaagatg gtcgctcccc tcaaatcgag gaatctctgc acaaccccta 420
tcctgattac cactggctga gaaccgtgcg gaccacaaag gaatccctga tcattatctc 480
tccaagcgtg accgacctgg atccttacga caagagcctg cacagcaggg tgttcccagg 540
cagaaagtgc agcgggatca cagtgagcag cacctactgc agcaccaatc acgattatac 600
agtgtggatg cctgagatcc tgcggctggg aacatcttgt gacatcttta caaatagcag 660
aggaaagaga gcctctaagg gcagcaagac ctgcggcttc gtggacgaga gaggcctgta 720
caagtccctg aaaggcgcct gcaagctgaa gctctgtggc gtgcctggcc tcagactgat 780
ggacggcacc tgggtcgcca tgcagaccag caacgagaca aagtggtgcc ctcctggcca 840
gctggtgaac ctgcacgacc tgcatagcga cgaaattgag cacctggtgg tggaagagct 900
ggtgaagaaa agagaggaat gcctggacgc cctggaaagc attaccacaa ccaagagcgt 960
ctccttccgg agactgagcc acctgagaaa gctggtgcct ggctttggaa aggcctacac 1020
catcttcaac aagaccctga tggaagctga ggctcactac aagagcgtgc ggacctggaa 1080
cgagatcatc ccatctaaag gctgccttcg ggttggcggc ggatgtcacc cccacgtgaa 1140
tggcgttttc ttcaacggca tcatcctggg ccctgatggc cacgtgctga tccctgagat 1200
gcagtcttct ctcctgcagc agcacatcga gctgctggaa agcagcgtga tccccctgat 1260
gcaccctctg gccgacccat tcaccgtttt caaagacggc gacgagatcg aggatttcgt 1320
ggaagtgcat ctgcccgacg tgcacgagca ggtgtctggc gtcgacctgg gcctgcctaa 1380
ctggggcgag tacgtgctcc tgagcgccgg cacactgatc gccctgatgc tgatcatctt 1440
tctgatcacc tgctgtaaaa gagtggatag acccgagtct acacagcgga gcctgagagg 1500
caccggaagg aacgtgtccg tgaccagcca gagcggcaag ttcatcccta gcagagaatc 1560
ttacaagtcc ggcggcgaga ccggcctgtg aattcacccc accagtg 1607
<210> 528
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain China/DRV
<400> 528
Met Val Pro Gln Ala Leu Leu Leu Val Pro Leu Leu Gly Phe Ser Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Thr Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Arg Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Met Pro Gly Cys
100 105 110
Met Tyr Ser Arg Val Gln Leu Glu Asp Gly Arg Ser Pro Gln Ile Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Arg
165 170 175
Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Val Trp Met Pro Glu Ile Leu Arg Leu Gly Thr Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Pro Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asn Glu Thr Lys Trp Cys Pro
260 265 270
Pro Gly Gln Leu Val Asn Leu His Asp Leu His Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Thr Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Glu Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Gly Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Ile Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Phe Thr Val Phe Lys Asp Gly Asp Glu Ile Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Glu Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Glu Tyr Val Leu Leu Ser Ala
450 455 460
Gly Thr Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Ile Thr Cys Cys
465 470 475 480
Lys Arg Val Asp Arg Pro Glu Ser Thr Gln Arg Ser Leu Arg Gly Thr
485 490 495
Gly Arg Asn Val Ser Val Thr Ser Gln Ser Gly Lys Phe Ile Pro Ser
500 505 510
Arg Glu Ser Tyr Lys Ser Gly Gly Glu Thr Gly Leu
515 520
<210> 529
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain China/MRV
<400> 529
acgtgagatc gccaccatgg tgccccaggt gctgctgttc gtgttactgc tgggattcag 60
cctgtgtttt ggcaagttcc caatctacac catccccgac gagctgggcc cttggagccc 120
tatcgacatc caccacctgt cctgccccaa caacctggtc gtcgaggacg agggctgtac 180
caacctgagc gagttcagct acatggagct gaaggtgggc tacatcagcg ccatcaaggt 240
gaatggattt acctgtacag gcgtggtgac cgaggccgag acatacacaa acttcgtggg 300
ttatgtgacc accaccttca agagaaagca cttcagacct acacctgacg cgtgcagagc 360
tgcttacaac tggaagatgg ccggagatcc tagatacgag gaatccctgc ataatcctta 420
tcctgattac cactggctgc ggaccgtgcg gacaaccaag gaaagcctga tcatcatcag 480
ccctagcgtt accgacctgg acccctacga caagagcctg cacagcagag tgttccccgg 540
cagaaagtgc agcggcatca ccgtgtccag cacctactgc agcaccaacc acgactacac 600
catctggatg cctgagaacc cccggcctag aacaccgtgc gacatcttca ccaacagcag 660
aggaaaacgc gcttctaacg gcaacaagac atgtggcttc gtggacgaaa gaggcctgta 720
caaaagcctc aagggcgctt gtagactgaa gctgtgcggc gtgctgggcc tgagactgat 780
ggacggcacc tgggtggcca tgcagaccag cggagaaacc aaatggtgcc cacctgatca 840
gctggtgaac cttcatgatt ttagatctga tgagatcgag cacctggtgg tggaagagct 900
ggtcaagaag cgggaggaat gcctggatgc cctggagagc atcatgacca caaagtctgt 960
ctcctttcgg agactgagcc acctgagaaa actggttcct ggcttcggca aggcctacac 1020
catctttaac aagaccctga tggaagccga cgcccactac aagtccgtgc ggacatggaa 1080
tgagattatc ccctctaaag gctgcctgaa agtgggcgga agatgccacc cccacgtgaa 1140
cggtgtgttc ttcaacggcc tgatcctggg acctgacgac cacgtgctga tcccagaaat 1200
gcagagcagc ctgctgcagc aacacatgga actgctggaa tcttctgtga tccctctgat 1260
gcaccctctg gccgatcctt ctacagtgtt caaggaaggc gacgaggccg aggatttcgt 1320
tgaagtgcac ctgcctgacg tgtacaagca gatcagcggc gtggacctgg gccttcctaa 1380
ctggggcaaa tacgtgctga tgacagccgg cgccatgatc ggcctggtgc tcatcttcag 1440
cctgatgacc tggtgcaggc gggccaacag acccgagtcc aagcagagaa gcttcggcgg 1500
cacaggcgga aatgtgtctg tgacatctca gagcggcaag gtgatcccaa gctgggagtc 1560
atacaagagc gggggcgaga ttcggctgtg aattcacccc accagtg 1607
<210> 530
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain China/MRV
<400> 530
Met Val Pro Gln Val Leu Leu Phe Val Leu Leu Leu Gly Phe Ser Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Glu Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Glu Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Arg Thr Thr Lys Glu Ser Leu Ile Ile Ile Ser Pro Ser Val Thr Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Arg
165 170 175
Lys Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Pro Arg Thr Pro Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Asn Gly Asn Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Arg Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Gly Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Leu Ile Leu
370 375 380
Gly Pro Asp Asp His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Glu Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val Tyr Lys Gln Ile Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Met Thr Ala
450 455 460
Gly Ala Met Ile Gly Leu Val Leu Ile Phe Ser Leu Met Thr Trp Cys
465 470 475 480
Arg Arg Ala Asn Arg Pro Glu Ser Lys Gln Arg Ser Phe Gly Gly Thr
485 490 495
Gly Gly Asn Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Pro Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Ile Arg Leu
515 520
<210> 531
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus isolate Human/Algeria/1991
<400> 531
acgtgagatc gccaccatgg tgcctcaggc cctgttgttc gtgcccctgc tggtgttccc 60
cctgtgcttc ggcaagttcc ctatctacac cattccagac aagctgggcc cttggtcccc 120
aatcgacatc caccacctgc ggtgccctaa caacctggtg gtcgaggacg agggctgtac 180
caacctgagc ggattcagct acatggaact gaaagtgggc tacatcagcg ccatcaaggt 240
gaatggcttc acctgtaccg gcgtggtgac cgaggccgag acatacacca acttcgtggg 300
ctatgtcaca acaactttta agagaaagca cttccggcct acccctgatg cttgtagagc 360
cgcttacaac tggaagatgg ccggcgaccc tagatacgag gaatccctgc acaaccctta 420
tcctgattac cactggctga gaaccgtgaa gaccacaaag gaaagcctgg tgatcatcag 480
ccctagcgtg gccgatctgg atccttacga caagtccctg cacagcagag tgtttccttc 540
tggcaactgc agcggaatca cagtttctag cacatactgc agcaccaacc acgactacac 600
catctggatg cctgagaacc ccagactgga aaccagctgc gacatcttca ccaatagccg 660
gggcaagaga gcctctaagg gcagcaagac atgcggcttc gtggacgaga gaggcctgta 720
caaaagcctg aagggcgcct gcaaactgaa actgtgtggc gtgctgggac tgagactgat 780
ggacggcacc tgggtggcca tgcaaacatc agatgaaacc aaatggtgcc cacctgacca 840
gctggtgaac ctgcatgact tcagaagcga cgaaatcgag cacctggtgg tggaagagct 900
ggtgaaaaag cgggaagagt gcctggacgc cctggaaagc atcatgacca ccaagagcgt 960
ctccctgaga cggctttctc acctgagaaa gctggtcccc ggctttggca aggcctacac 1020
aatctttaac aagaccctga tggaagctga ggcccactac aagagcgtgc agacctggaa 1080
cgagatcatc cccagcaagg gttgtctgag ggtgggcggc agatgccacc cccacgtgaa 1140
tggagtgttc ttcaatggca tcatcctggg acctgatggc cacgtgctga ttccagagat 1200
gcagagctct ctgctccagc agcacatgga attactcgag agcagcgtga tccctctgat 1260
gcaccctctg gccgacccct ctaccgtgtt taaggacgga gatgaagccg aggatttcgt 1320
tgaagtgcac ctgcctgacg tgcataagca ggtgtccgga gtggacctgg gcctgcccaa 1380
ctggggcaag tacgtgctgc tgagcgctgg cacactgatc gccctgatgc tgatcatctt 1440
cctgatgacc tgctgcagac gcgtgaacag acctaagtcc accgagcgga gcctgggcga 1500
gacaggccgg aaggtgtccg tgaccagcca gtctggcaaa gtgatcagca gctgggagtc 1560
ttacaagagc ggaggcgaga caagacggtg aattcacccc accagtg 1607
<210> 532
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus isolate Human/Algeria/1991
<400> 532
Met Val Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Arg Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Asn Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Pro Arg Leu Glu Thr Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Arg Ala Ser Lys Gly Ser Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Leu Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Glu Ala His Tyr Lys Ser Val Gln
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Gly
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Asn Trp Gly Lys Tyr Val Leu Leu Ser Ala
450 455 460
Gly Thr Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Pro Lys Ser Thr Glu Arg Ser Leu Gly Glu Thr
485 490 495
Gly Arg Lys Val Ser Val Thr Ser Gln Ser Gly Lys Val Ile Ser Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Arg
515 520
<210> 533
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain HEP-Flury
<400> 533
acgtgagatc gccaccatgg tcccccaggt gctgctgttc gcccctctgc tggtgtttcc 60
actgtgcttc ggcaagttcc ctatctacac aatccctgac aagctcggac cttggtcccc 120
tatcgacctg caccacctgt cctgccccaa caacctggtg gtcgaggacg aaggctgtac 180
caatctgagc ggattcagct acatggagct gaaggtgggc tacatcagcg ccatcaaggt 240
gaacggcttc acatgtacag gcgtggtgac agaggccgaa acatacacca acttcgtggg 300
ctatgtgacc acaacattca aaagaaagca cttcagaccg acccctgatg cctgcagagc 360
cgcttacaac tggaagatgg ccggcgatcc tagatacgag gagtctctgc ataatcctta 420
tcctgattac cactggctgc ggaccgtgaa gacaaccaag gaatctctgg tgatcatttc 480
tccttctgtg acagacctgg atccttacga caagagcctg cacagcagag tcttccccgg 540
cggcaactgc agcggcatca ccgtgtccag cacatactgc agcaccaacc acgactacac 600
catctggatg cctgagaacc tgcggctggg cactagctgc gacatcttta cccactctag 660
aggcaaacgg gccagcaagg gagataagac ctgtggcttt gtggatgaac ggggcctgta 720
caaatccctg aagggagcct gtaaactgaa actgtgcggc gtgctgggtc tgcgcctgat 780
ggacgggacc tgggtggcca tgcaaaccag cgacgagaca aagtggtgcc ctcctggcca 840
gctggtcaac ctccatgatt tcagaagcga cgagatcgag cacctggtgg aagaggagct 900
tgttaagaag agagaagagt gcctggacgc tctggaatcc atcatgacca caaaaagcgt 960
gtcttttcgg cggctgagcc acctgaggaa gctggtgccc ggcttcggca aggcctacac 1020
catcttcaac aagaccctga tggaagctga tgcccactac aaaagcgtgc agacctggaa 1080
cgagatcatc ccttctaagg gatgtctgcg agtgggcgag cggtgccacc ctcacgtgaa 1140
tggcgttttc ttcaacggca tcatcctggg atctgacggc cacgtgctga ttccagagat 1200
gcagagcagc ctgctgcaac agcacatgga gctgctggaa agcagcgtga tccccctgat 1260
gcaccccctg gccgacccca gcaccgtgtt caaggacggc gacgaggtgg aagattttgt 1320
ggaagtccac ttgcctgacg tgcacaagca ggtgtccggc gtggacctgg gcctacccaa 1380
gtggggaaag tacgtgctga tgatcgctgg cgccctgatc gccctgatgc tgattatctt 1440
cctgatgacc tgctgcagaa gagtgaacag acctgagagc acccagtcta atctgggtgg 1500
caccggcaga aacgtgtccg tgcctagcca gagcggcaag gtgatcagca gctgggagag 1560
ctacaagagc ggcggagaaa ccagactgtg aattcacccc accagtg 1607
<210> 534
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain HEP-Flury
<400> 534
Met Val Pro Gln Val Leu Leu Phe Ala Pro Leu Leu Val Phe Pro Leu
1 5 10 15
Cys Phe Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Leu His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Asn Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Ile Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Thr Pro Asp Ala
100 105 110
Cys Arg Ala Ala Tyr Asn Trp Lys Met Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Glu Ser Leu His Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Thr Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Gly Gly
165 170 175
Asn Cys Ser Gly Ile Thr Val Ser Ser Thr Tyr Cys Ser Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Glu Asn Leu Arg Leu Gly Thr Ser Cys
195 200 205
Asp Ile Phe Thr His Ser Arg Gly Lys Arg Ala Ser Lys Gly Asp Lys
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Leu Gly Leu Arg Leu Met Asp
245 250 255
Gly Thr Trp Val Ala Met Gln Thr Ser Asp Glu Thr Lys Trp Cys Pro
260 265 270
Pro Gly Gln Leu Val Asn Leu His Asp Phe Arg Ser Asp Glu Ile Glu
275 280 285
His Leu Val Glu Glu Glu Leu Val Lys Lys Arg Glu Glu Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Lys Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Gln
340 345 350
Thr Trp Asn Glu Ile Ile Pro Ser Lys Gly Cys Leu Arg Val Gly Glu
355 360 365
Arg Cys His Pro His Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Ser Asp Gly His Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Val Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Val Ser Gly
435 440 445
Val Asp Leu Gly Leu Pro Lys Trp Gly Lys Tyr Val Leu Met Ile Ala
450 455 460
Gly Ala Leu Ile Ala Leu Met Leu Ile Ile Phe Leu Met Thr Cys Cys
465 470 475 480
Arg Arg Val Asn Arg Pro Glu Ser Thr Gln Ser Asn Leu Gly Gly Thr
485 490 495
Gly Arg Asn Val Ser Val Pro Ser Gln Ser Gly Lys Val Ile Ser Ser
500 505 510
Trp Glu Ser Tyr Lys Ser Gly Gly Glu Thr Arg Leu
515 520
<210> 535
<211> 1607
<212> DNA
<213> Lyssavirus Rabies virus strain silver-haired bat-associated
<400> 535
acgtgagatc gccaccatga tcccacaggc cctgctgttc gtgcccctgc tgatccccag 60
cctgtgtctg ggcaaattcc ccatctacac cattcctgat aagctgggcc cttggagccc 120
tatcgacatc caccacctga gctgccccaa caacctggtg gtcgaggacg agggctgtac 180
tagcctgtcc ggatttagct acatggagct gaaggtgggc tacatcagcg ccatgaaagt 240
gaacggattc acctgcaccg gcgtggtgac cgaggccgag acatacacca acttcgtcgg 300
atacgtcaca acaacattca agcggaagca cttcagacct atgccagacg cctgcagagc 360
tgctcacgac tggaagatcg ccggcgatcc acggtacgag gacagcctgc aaaatcctta 420
tcctgattac cactggctga ggacagtgaa gaccaccaag gaaagcctag tgatcatcag 480
tccttctgtg gctgatctgg atccttacga caagagcctg cattctagag tgtttcctag 540
cggcaagtgc ctgggtatca ccgtgtctag cacctactgc cctacaaatc acgattacac 600
tatctggatg cctgtggaag ccagactggg aacaagttgc gacatcttta ccaacagccg 660
gggcaagaag gccagcaaag gcggaagaac ctgtggcttt gtggacgaaa gaggccttta 720
taagagcctg aagggcgcct gtaaactgaa gttgtgcgga gttcctggcc tgagactgat 780
gaacggcaca tgggtgtcca tccagaccag cgacgacatc aagtggtgcc ctcccgatca 840
gctggttaat ctgcacgact tccactctga cgagatcgag cacctggtgg tggaggaact 900
gatcaagaaa agagaaggat gtctcgatgc cctggaaagc atcatgacca caaagtccgt 960
ctccttccgg cgcctgagcc acctgagaaa gctggtcccc ggcttcggca aagcctacac 1020
catcttcaac aacaccctga tggaagccga cgcgcactac aagtctgtta gaacctggaa 1080
cgaggtgatc ccttctaaag gctgcctgaa ggtgggaggc agatgccacc ctcctgtgaa 1140
cggcgtgttc ttcaacggca tcatcctggg cccagacggc aacgtgctga tccctgagat 1200
gcagagctct ctgctgcagc agcacatgga actgctcgaa agcagcgtga tccccctgat 1260
gcaccccctg gctgacccct ccaccgtgtt caaggacggc gacgaggctg aagatttcgt 1320
ggaagtgcac ctgcccgacg tgcataagca ggtgtccgac gtggacctgg gcctgcctag 1380
ctggggcaag tacctgctca tgagcgccgg agccctggcc accctgattc tggccatctt 1440
cctgattaca tgctgcagac gggccaatcg gaccaagtct acccagcggg gccacagaga 1500
gagcggcggc aaggtgagcg tggcccctca aaacggcaaa atcatcagca gctgggagct 1560
gtacaagagc gagagcgaga caggcatgtg aattcacccc accagtg 1607
<210> 536
<211> 524
<212> PRT
<213> Lyssavirus Rabies virus strain silver-haired bat-associated
<400> 536
Met Ile Pro Gln Ala Leu Leu Phe Val Pro Leu Leu Ile Pro Ser Leu
1 5 10 15
Cys Leu Gly Lys Phe Pro Ile Tyr Thr Ile Pro Asp Lys Leu Gly Pro
20 25 30
Trp Ser Pro Ile Asp Ile His His Leu Ser Cys Pro Asn Asn Leu Val
35 40 45
Val Glu Asp Glu Gly Cys Thr Ser Leu Ser Gly Phe Ser Tyr Met Glu
50 55 60
Leu Lys Val Gly Tyr Ile Ser Ala Met Lys Val Asn Gly Phe Thr Cys
65 70 75 80
Thr Gly Val Val Thr Glu Ala Glu Thr Tyr Thr Asn Phe Val Gly Tyr
85 90 95
Val Thr Thr Thr Phe Lys Arg Lys His Phe Arg Pro Met Pro Asp Ala
100 105 110
Cys Arg Ala Ala His Asp Trp Lys Ile Ala Gly Asp Pro Arg Tyr Glu
115 120 125
Asp Ser Leu Gln Asn Pro Tyr Pro Asp Tyr His Trp Leu Arg Thr Val
130 135 140
Lys Thr Thr Lys Glu Ser Leu Val Ile Ile Ser Pro Ser Val Ala Asp
145 150 155 160
Leu Asp Pro Tyr Asp Lys Ser Leu His Ser Arg Val Phe Pro Ser Gly
165 170 175
Lys Cys Leu Gly Ile Thr Val Ser Ser Thr Tyr Cys Pro Thr Asn His
180 185 190
Asp Tyr Thr Ile Trp Met Pro Val Glu Ala Arg Leu Gly Thr Ser Cys
195 200 205
Asp Ile Phe Thr Asn Ser Arg Gly Lys Lys Ala Ser Lys Gly Gly Arg
210 215 220
Thr Cys Gly Phe Val Asp Glu Arg Gly Leu Tyr Lys Ser Leu Lys Gly
225 230 235 240
Ala Cys Lys Leu Lys Leu Cys Gly Val Pro Gly Leu Arg Leu Met Asn
245 250 255
Gly Thr Trp Val Ser Ile Gln Thr Ser Asp Asp Ile Lys Trp Cys Pro
260 265 270
Pro Asp Gln Leu Val Asn Leu His Asp Phe His Ser Asp Glu Ile Glu
275 280 285
His Leu Val Val Glu Glu Leu Ile Lys Lys Arg Glu Gly Cys Leu Asp
290 295 300
Ala Leu Glu Ser Ile Met Thr Thr Lys Ser Val Ser Phe Arg Arg Leu
305 310 315 320
Ser His Leu Arg Lys Leu Val Pro Gly Phe Gly Lys Ala Tyr Thr Ile
325 330 335
Phe Asn Asn Thr Leu Met Glu Ala Asp Ala His Tyr Lys Ser Val Arg
340 345 350
Thr Trp Asn Glu Val Ile Pro Ser Lys Gly Cys Leu Lys Val Gly Gly
355 360 365
Arg Cys His Pro Pro Val Asn Gly Val Phe Phe Asn Gly Ile Ile Leu
370 375 380
Gly Pro Asp Gly Asn Val Leu Ile Pro Glu Met Gln Ser Ser Leu Leu
385 390 395 400
Gln Gln His Met Glu Leu Leu Glu Ser Ser Val Ile Pro Leu Met His
405 410 415
Pro Leu Ala Asp Pro Ser Thr Val Phe Lys Asp Gly Asp Glu Ala Glu
420 425 430
Asp Phe Val Glu Val His Leu Pro Asp Val His Lys Gln Val Ser Asp
435 440 445
Val Asp Leu Gly Leu Pro Ser Trp Gly Lys Tyr Leu Leu Met Ser Ala
450 455 460
Gly Ala Leu Ala Thr Leu Ile Leu Ala Ile Phe Leu Ile Thr Cys Cys
465 470 475 480
Arg Arg Ala Asn Arg Thr Lys Ser Thr Gln Arg Gly His Arg Glu Ser
485 490 495
Gly Gly Lys Val Ser Val Ala Pro Gln Asn Gly Lys Ile Ile Ser Ser
500 505 510
Trp Glu Leu Tyr Lys Ser Glu Ser Glu Thr Gly Met
515 520
<210> 537
<211> 2715
<212> DNA
<213> Simplexvirus Herpes simplex virus type 2
<400> 537
atgcggggtg gcggactgat atgtgcactg gtagttgggg cattggtggc agctgtcgca 60
tctgccgctc ctgccgcgcc agcagctcct cgtgcttcag gtggggtagc tgctactgtg 120
gcagccaatg gcgggcctgc aagtcgtcca ccacctgtac cttcccctgc cacgacgaaa 180
gctaggaaaa gaaagacaaa gaaaccccca aaacgcccgg aagccacacc accgcctgat 240
gctaatgcca cagtggctgc aggacatgct acactccgag cacatcttag agagattaaa 300
gtggaaaatg ctgacgctca attctatgtt tgtcccccac caacaggagc taccgtcgtt 360
caattcgaac aacccagacg atgtcccacc cggccagaag gacaaaatta tactgaaggt 420
attgccgtcg tgtttaaaga aaatattgca ccctataagt ttaaagcaac tatgtattac 480
aaggacgtca cagtctccca agtatggttt ggacatcggt atagccaatt catgggcatc 540
tttgaagata gggcacctgt gccttttgaa gaagtcatag ataaaatcaa tgctaaaggc 600
gtgtgtcgtt ctactgcaaa atatgtacgc aataatatgg aaactacagc cttccataga 660
gatgatcatg aaactgatat ggaactgaaa cccgcaaaag tagcaacccg gacaagtcga 720
ggatggcata caacggattt gaaatataat ccttctcgag tagaagcctt tcacaggtat 780
ggtaccaccg ttaattgtat agttgaagaa gttgatgcta ggagcgttta tccatatgac 840
gaattcgttc tggccacagg agatttcgtt tatatgagcc cattctatgg atatagagaa 900
ggttctcata ctgaacatac gtcctatgca gcagatcgat ttaaacaagt ggatggattt 960
tatgcccggg atctgacgac aaaagcacga gcaacctcac ctaccacaag aaatcttctc 1020
actacaccaa aattcacagt cgcgtgggat tgggtaccta aaagacccgc cgtttgtaca 1080
atgactaaat ggcaagaagt cgatgaaatg ttgcgtgcag aatatggcgg aagctttagg 1140
ttttcatctg atgcaattag cactacattt actacgaatc tcacgcaata tagtctgtct 1200
agagtggatc ttggtgattg tatagggcgc gacgcaagag aagctattga tcgaatgttc 1260
gcaagaaaat ataatgctac ccatataaaa gttgggcaac cacaatatta tttggcgaca 1320
ggcggttttc tgatagccta tcaaccactg ctgtccaata ccttggctga actctatgtt 1380
agggaatata tgagagaaca agataggaaa ccaaggaacg cgaccccagc acctcttagg 1440
gaagctccat ctgcaaatgc tagcgttgaa agaattaaaa caacatcttc catagaattt 1500
gcaaggttgc aattcacata caatcatatt caacggcatg ttaatgatat gctcggccgg 1560
attgctgtgg catggtgtga acttcaaaat catgaactca cgctgtggaa tgaagcgagg 1620
aaactgaatc ctaatgctat tgctagtgct acggttggaa ggcgagtttc agctagaatg 1680
cttggtgatg tgatggctgt ttcaacttgt gtaccggtgg cacccgataa tgtcattgtt 1740
caaaattcca tgcgggtatc atcaagacca ggtacatgtt atagtcggcc gctcgtgtcc 1800
ttcagatatg aggatcaagg accacttatt gaaggacaac ttggtgaaaa taatgaactt 1860
cggctgacta gagatgcttt ggaaccatgt acagttggtc atcgtcggta ttttattttc 1920
ggaggaggtt atgtttattt tgaagaatat gcttatagcc atcagttgtc cagggctgat 1980
gtgactacag tgtctacatt tattgatctt aacataacta tgctcgaaga tcatgaattc 2040
gtcccacttg aagtgtatac ccgtcatgaa attaaagatt ctggtctcct tgattatacc 2100
gaagtacaac ggcggaatca actccatgat ctcagattcg ctgatattga tacagtaatt 2160
cgggcagatg caaatgctgc tatgtttgca ggtctttgtg ccttcttcga aggcatggga 2220
gatctgggtc gggccgttgg gaaagtggtg atgggcgtgg tcggcggagt cgtatctgcg 2280
gtttctgggg tttcaagttt catgagtaat ccttttggcg ccctggcagt tggcctgctc 2340
gtacttgcgg gtcttgtagc cgcgttcttc gcgtttcggt atgtgcttca gcttcagagg 2400
aaccctatga aagcgctcta ccccctgaca actaaagagc tgaaaacgtc tgatcctggt 2460
ggggtcggcg gagaaggaga agagggagca gaaggcggcg gattcgatga agcaaaactc 2520
gctgaagcta gggagatgat aagatacatg gcgcttgtaa gtgcgatgga acggactgag 2580
cataaagctc gtaagaaagg aacttctgct ctcctgtctt ctaaagtaac taatatggtc 2640
ttgcggaaaa ggaataaggc acgatattct cccctgcata atgaagatga agcaggcgat 2700
gaggatgaac tgtga 2715
<210> 538
<211> 904
<212> PRT
<213> Simplexvirus Herpes simplex virus type 2
<400> 538
Met Arg Gly Gly Gly Leu Ile Cys Ala Leu Val Val Gly Ala Leu Val
1 5 10 15
Ala Ala Val Ala Ser Ala Ala Pro Ala Ala Pro Ala Ala Pro Arg Ala
20 25 30
Ser Gly Gly Val Ala Ala Thr Val Ala Ala Asn Gly Gly Pro Ala Ser
35 40 45
Arg Pro Pro Pro Val Pro Ser Pro Ala Thr Thr Lys Ala Arg Lys Arg
50 55 60
Lys Thr Lys Lys Pro Pro Lys Arg Pro Glu Ala Thr Pro Pro Pro Asp
65 70 75 80
Ala Asn Ala Thr Val Ala Ala Gly His Ala Thr Leu Arg Ala His Leu
85 90 95
Arg Glu Ile Lys Val Glu Asn Ala Asp Ala Gln Phe Tyr Val Cys Pro
100 105 110
Pro Pro Thr Gly Ala Thr Val Val Gln Phe Glu Gln Pro Arg Arg Cys
115 120 125
Pro Thr Arg Pro Glu Gly Gln Asn Tyr Thr Glu Gly Ile Ala Val Val
130 135 140
Phe Lys Glu Asn Ile Ala Pro Tyr Lys Phe Lys Ala Thr Met Tyr Tyr
145 150 155 160
Lys Asp Val Thr Val Ser Gln Val Trp Phe Gly His Arg Tyr Ser Gln
165 170 175
Phe Met Gly Ile Phe Glu Asp Arg Ala Pro Val Pro Phe Glu Glu Val
180 185 190
Ile Asp Lys Ile Asn Ala Lys Gly Val Cys Arg Ser Thr Ala Lys Tyr
195 200 205
Val Arg Asn Asn Met Glu Thr Thr Ala Phe His Arg Asp Asp His Glu
210 215 220
Thr Asp Met Glu Leu Lys Pro Ala Lys Val Ala Thr Arg Thr Ser Arg
225 230 235 240
Gly Trp His Thr Thr Asp Leu Lys Tyr Asn Pro Ser Arg Val Glu Ala
245 250 255
Phe His Arg Tyr Gly Thr Thr Val Asn Cys Ile Val Glu Glu Val Asp
260 265 270
Ala Arg Ser Val Tyr Pro Tyr Asp Glu Phe Val Leu Ala Thr Gly Asp
275 280 285
Phe Val Tyr Met Ser Pro Phe Tyr Gly Tyr Arg Glu Gly Ser His Thr
290 295 300
Glu His Thr Ser Tyr Ala Ala Asp Arg Phe Lys Gln Val Asp Gly Phe
305 310 315 320
Tyr Ala Arg Asp Leu Thr Thr Lys Ala Arg Ala Thr Ser Pro Thr Thr
325 330 335
Arg Asn Leu Leu Thr Thr Pro Lys Phe Thr Val Ala Trp Asp Trp Val
340 345 350
Pro Lys Arg Pro Ala Val Cys Thr Met Thr Lys Trp Gln Glu Val Asp
355 360 365
Glu Met Leu Arg Ala Glu Tyr Gly Gly Ser Phe Arg Phe Ser Ser Asp
370 375 380
Ala Ile Ser Thr Thr Phe Thr Thr Asn Leu Thr Gln Tyr Ser Leu Ser
385 390 395 400
Arg Val Asp Leu Gly Asp Cys Ile Gly Arg Asp Ala Arg Glu Ala Ile
405 410 415
Asp Arg Met Phe Ala Arg Lys Tyr Asn Ala Thr His Ile Lys Val Gly
420 425 430
Gln Pro Gln Tyr Tyr Leu Ala Thr Gly Gly Phe Leu Ile Ala Tyr Gln
435 440 445
Pro Leu Leu Ser Asn Thr Leu Ala Glu Leu Tyr Val Arg Glu Tyr Met
450 455 460
Arg Glu Gln Asp Arg Lys Pro Arg Asn Ala Thr Pro Ala Pro Leu Arg
465 470 475 480
Glu Ala Pro Ser Ala Asn Ala Ser Val Glu Arg Ile Lys Thr Thr Ser
485 490 495
Ser Ile Glu Phe Ala Arg Leu Gln Phe Thr Tyr Asn His Ile Gln Arg
500 505 510
His Val Asn Asp Met Leu Gly Arg Ile Ala Val Ala Trp Cys Glu Leu
515 520 525
Gln Asn His Glu Leu Thr Leu Trp Asn Glu Ala Arg Lys Leu Asn Pro
530 535 540
Asn Ala Ile Ala Ser Ala Thr Val Gly Arg Arg Val Ser Ala Arg Met
545 550 555 560
Leu Gly Asp Val Met Ala Val Ser Thr Cys Val Pro Val Ala Pro Asp
565 570 575
Asn Val Ile Val Gln Asn Ser Met Arg Val Ser Ser Arg Pro Gly Thr
580 585 590
Cys Tyr Ser Arg Pro Leu Val Ser Phe Arg Tyr Glu Asp Gln Gly Pro
595 600 605
Leu Ile Glu Gly Gln Leu Gly Glu Asn Asn Glu Leu Arg Leu Thr Arg
610 615 620
Asp Ala Leu Glu Pro Cys Thr Val Gly His Arg Arg Tyr Phe Ile Phe
625 630 635 640
Gly Gly Gly Tyr Val Tyr Phe Glu Glu Tyr Ala Tyr Ser His Gln Leu
645 650 655
Ser Arg Ala Asp Val Thr Thr Val Ser Thr Phe Ile Asp Leu Asn Ile
660 665 670
Thr Met Leu Glu Asp His Glu Phe Val Pro Leu Glu Val Tyr Thr Arg
675 680 685
His Glu Ile Lys Asp Ser Gly Leu Leu Asp Tyr Thr Glu Val Gln Arg
690 695 700
Arg Asn Gln Leu His Asp Leu Arg Phe Ala Asp Ile Asp Thr Val Ile
705 710 715 720
Arg Ala Asp Ala Asn Ala Ala Met Phe Ala Gly Leu Cys Ala Phe Phe
725 730 735
Glu Gly Met Gly Asp Leu Gly Arg Ala Val Gly Lys Val Val Met Gly
740 745 750
Val Val Gly Gly Val Val Ser Ala Val Ser Gly Val Ser Ser Phe Met
755 760 765
Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val Leu Ala Gly
770 775 780
Leu Val Ala Ala Phe Phe Ala Phe Arg Tyr Val Leu Gln Leu Gln Arg
785 790 795 800
Asn Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Glu Leu Lys Thr
805 810 815
Ser Asp Pro Gly Gly Val Gly Gly Glu Gly Glu Glu Gly Ala Glu Gly
820 825 830
Gly Gly Phe Asp Glu Ala Lys Leu Ala Glu Ala Arg Glu Met Ile Arg
835 840 845
Tyr Met Ala Leu Val Ser Ala Met Glu Arg Thr Glu His Lys Ala Arg
850 855 860
Lys Lys Gly Thr Ser Ala Leu Leu Ser Ser Lys Val Thr Asn Met Val
865 870 875 880
Leu Arg Lys Arg Asn Lys Ala Arg Tyr Ser Pro Leu His Asn Glu Asp
885 890 895
Glu Ala Gly Asp Glu Asp Glu Leu
900
<210> 539
<211> 1182
<212> DNA
<213> Simplexvirus Herpes simplex virus type 2
<400> 539
atggggcgtt tgacctccgg cgtcgggacg gcggccctgc tagttgtcgc ggtgggactc 60
cgcgtcgtct gcgccaaata cgccttagca gacccctcgc ttaagatggc cgatcccaat 120
cgatttcgcg ggaagaacct tccggttttg gaccagctga ccgacccccc cggggtgaag 180
cgtgtttacc acattcagcc gagcctggag gacccgttcc agccccccag catcccgatc 240
actgtgtact acgcagtgct ggaacgtgcc tgccgcagcg tgctcctaca tgccccatcg 300
gaggcccccc agatcgtgcg cggggcttcg gacgaggccc gaaagcacac gtacaacctg 360
accatcgcct ggtatcgcat gggagacaat tgcgctatcc ccatcacggt tatggaatac 420
accgagtgcc cctacaacaa gtcgttgggg gtctgcccca tccgaacgca gccccgctgg 480
agctactatg acagctttag cgccgtcagc gaggataacc tgggattcct gatgcacgcc 540
cccgccttcg agaccgcggg tacgtacctg cggctagtga agataaacga ctggacggag 600
atcacacaat ttatcctgga gcaccgggcc cgcgcctcct gcaagtacgc tctccccctg 660
cgcatccccc cggcagcgtg cctcacctcg aaggcctacc aacagggcgt gacggtcgac 720
agcatcggga tgttaccccg ctttactccc gaaaaccagc gcaccgtcgc cctatacagc 780
ttaaaaatcg ccgggtggca cggccccaag cccccgtaca ccagcaccct gctgccgccg 840
gagctgtccg acaccaccaa cgccacgcaa cccgaactcg ttccggaaga ccccgaggac 900
tcggccctct tagaggatcc cgccgggacg gtgtcttcgc agatcccccc aaactggcac 960
atcccgtcga tccaggacgt cgcgccgcac cacgcccccg ccgccccagc caacccgggc 1020
ctgatcatcg gcgcgctggc cggcagtacc ctggcggcgc tggtcatcgg cggtattgcg 1080
ttttgggtac gccgccggcg ctcagtggcc cccaagcgcc tacgtctccc ccacatccgg 1140
gatgacgacg cgcccccctc gcaccagcca ttgttttact ag 1182
<210> 540
<211> 393
<212> PRT
<213> Simplexvirus Herpes simplex virus type 2
<400> 540
Met Gly Arg Leu Thr Ser Gly Val Gly Thr Ala Ala Leu Leu Val Val
1 5 10 15
Ala Val Gly Leu Arg Val Val Cys Ala Lys Tyr Ala Leu Ala Asp Pro
20 25 30
Ser Leu Lys Met Ala Asp Pro Asn Arg Phe Arg Gly Lys Asn Leu Pro
35 40 45
Val Leu Asp Gln Leu Thr Asp Pro Pro Gly Val Lys Arg Val Tyr His
50 55 60
Ile Gln Pro Ser Leu Glu Asp Pro Phe Gln Pro Pro Ser Ile Pro Ile
65 70 75 80
Thr Val Tyr Tyr Ala Val Leu Glu Arg Ala Cys Arg Ser Val Leu Leu
85 90 95
His Ala Pro Ser Glu Ala Pro Gln Ile Val Arg Gly Ala Ser Asp Glu
100 105 110
Ala Arg Lys His Thr Tyr Asn Leu Thr Ile Ala Trp Tyr Arg Met Gly
115 120 125
Asp Asn Cys Ala Ile Pro Ile Thr Val Met Glu Tyr Thr Glu Cys Pro
130 135 140
Tyr Asn Lys Ser Leu Gly Val Cys Pro Ile Arg Thr Gln Pro Arg Trp
145 150 155 160
Ser Tyr Tyr Asp Ser Phe Ser Ala Val Ser Glu Asp Asn Leu Gly Phe
165 170 175
Leu Met His Ala Pro Ala Phe Glu Thr Ala Gly Thr Tyr Leu Arg Leu
180 185 190
Val Lys Ile Asn Asp Trp Thr Glu Ile Thr Gln Phe Ile Leu Glu His
195 200 205
Arg Ala Arg Ala Ser Cys Lys Tyr Ala Leu Pro Leu Arg Ile Pro Pro
210 215 220
Ala Ala Cys Leu Thr Ser Lys Ala Tyr Gln Gln Gly Val Thr Val Asp
225 230 235 240
Ser Ile Gly Met Leu Pro Arg Phe Thr Pro Glu Asn Gln Arg Thr Val
245 250 255
Ala Leu Tyr Ser Leu Lys Ile Ala Gly Trp His Gly Pro Lys Pro Pro
260 265 270
Tyr Thr Ser Thr Leu Leu Pro Pro Glu Leu Ser Asp Thr Thr Asn Ala
275 280 285
Thr Gln Pro Glu Leu Val Pro Glu Asp Pro Glu Asp Ser Ala Leu Leu
290 295 300
Glu Asp Pro Ala Gly Thr Val Ser Ser Gln Ile Pro Pro Asn Trp His
305 310 315 320
Ile Pro Ser Ile Gln Asp Val Ala Pro His His Ala Pro Ala Ala Pro
325 330 335
Ala Asn Pro Gly Leu Ile Ile Gly Ala Leu Ala Gly Ser Thr Leu Ala
340 345 350
Ala Leu Val Ile Gly Gly Ile Ala Phe Trp Val Arg Arg Arg Arg Ser
355 360 365
Val Ala Pro Lys Arg Leu Arg Leu Pro His Ile Arg Asp Asp Asp Ala
370 375 380
Pro Pro Ser His Gln Pro Leu Phe Tyr
385 390
<210> 541
<211> 2517
<212> DNA
<213> Simplexvirus Herpes simplex virus type 2
<400> 541
atgggtccag gcttgtgggt tgtgatgggt gtgttggttg gtgtcgcagg cggacacgat 60
acctattgga ccgaacagat tgatccttgg ttcctgcatg ggcttggact tgcgaggacc 120
tattggagag ataccaatac aggacggctt tggctgccaa atactcctga tgcatccgat 180
cctcaaagag ggcggcttgc accaccaggt gagctgaatc tcacaactgc cagcgtccca 240
atgttgcgct ggtatgcaga acggttctgc tttgtcctcg taactacagc tgaattcccc 300
cgcgatcctg gacaactcct gtatattcct aaaacttacc tgctggggag accacgcaat 360
gcttctttgc cagaattgcc tgaagccggt ccgacaagca ggccaccagc agaagtcact 420
caactgaaag ggttgtctca taatccaggg gctagcgctc ttctcagaag tagagcatgg 480
gttacctttg ctgcagcccc agatagggaa ggactgacct ttccccgtgg cgatgatggc 540
gctacagaaa gacatcccga tggaaggaga aatgctccac cccctggtcc ccctgccggc 600
acaccccgac acccaacaac aaatctttcc atagcccacc tgcataatgc ttcagttact 660
tggttggcgg ctcggggttt gctgagaacc cctggcagat atgtctatct tagtcctagt 720
gcgagtacct ggcctgtcgg agtgtggacc accggtggcc ttgcctttgg atgtgatgcg 780
gcccttgtta gagccaggta tggaaaagga tttatgggct tggttattag tatgagagat 840
tctccccctg cagaaattat tgtagtacca gcagataaaa ctctggcgcg tgtggggaac 900
ccaactgatg agaatgcacc agctgtcctt cctggcccac ccgcgggacc tcgttacagg 960
gtgttcgtac tcggcgcgcc cacaccggca gataatgggt cagctctcga tgcactgaga 1020
cgtgttgctg ggtatcctga agaatctaca aattatgctc aatacatgag tagagcttac 1080
gccgaattcc tcggcgaaga tccaggtagc gggacagatg caaggccaag tctcttttgg 1140
cgcctggctg gcctcttggc ttcaagcgga ttcgcctttg ttaatgccgc tcatgcacat 1200
gatgcaatcc ggctgtcaga tctcctcggt ttcctggcgc attctagggt tcttgctggt 1260
ttggcggcac gaggggctgc aggatgtgcc gcagattcag tatttcttaa tgtatctgta 1320
cttgatcccg ctgctaggct cagattggaa gcacgactgg gccacctcgt cgcagctatt 1380
ttggaaagag aacaatccct cgtagcccat gcacttggtt accaacttgc ctttgttctg 1440
gatagtccag ccgcttacgg agccgtcgca ccaagtgccg cacggttgat tgatgctctt 1500
tatgctgaat tcctgggtgg tcgagcattg acagctccaa tggtaaggcg ggccttgttc 1560
tatgcgaccg cggttttgcg agcccctttt ctcgccggtg ccccaagcgc tgaacaaaga 1620
gagagggctc gaaggggatt gctgatcact accgctttgt gcacatcaga tgtagcagct 1680
gctactcatg ctgaccttcg tgcagccctg gcgcgcacgg atcatcaaaa gaatctgttt 1740
tggctgcctg atcatttctc accttgtgcc gcgtcactcc ggtttgacct tgcagaaggc 1800
ggatttatat tggatgcact tgcaatggct acacgcagtg atattccagc tgatgtaatg 1860
gcccagcaaa cacgcggggt cgctagcgtg ctgactaggt gggcccatta taatgctctt 1920
ataagagcat ttgtgcctga agctactcat caatgcagtg gtcccagcca taatgcagaa 1980
cctaggattc ttgtcccgat tactcataat gcatcctatg ttgtgactca tactcctctc 2040
ccaaggggaa ttggttataa attgaccgga gtcgatgtga gacgacctct tttcattacg 2100
tacctgactg ctacgtgtga gggtcatgcc agagaaatcg aaccaaagag actcgtccgg 2160
actgagaata ggcgagattt gggactggtc ggcgcagttt tcctgcgata tactcccgca 2220
ggagaagtta tgtccgtttt gctcgtagat accgacgcga ctcagcaaca acttgcacaa 2280
ggccctgttg ctggaacacc aaatgttttc tcttcagatg taccatcagt tgcgttgctt 2340
ctgtttccta atgggacagt catacacttg ctcgctttcg atacccttcc tattgcaact 2400
attgcaccgg gcttcctcgc agcaagcgct ttgggcgtgg taatgatcac agcagcactt 2460
gctgggatac tccgcgtcgt gcgtacatgt gtgcctttcc tgtggcgtag ggagtag 2517
<210> 542
<211> 838
<212> PRT
<213> Simplexvirus Herpes simplex virus type 2
<400> 542
Met Gly Pro Gly Leu Trp Val Val Met Gly Val Leu Val Gly Val Ala
1 5 10 15
Gly Gly His Asp Thr Tyr Trp Thr Glu Gln Ile Asp Pro Trp Phe Leu
20 25 30
His Gly Leu Gly Leu Ala Arg Thr Tyr Trp Arg Asp Thr Asn Thr Gly
35 40 45
Arg Leu Trp Leu Pro Asn Thr Pro Asp Ala Ser Asp Pro Gln Arg Gly
50 55 60
Arg Leu Ala Pro Pro Gly Glu Leu Asn Leu Thr Thr Ala Ser Val Pro
65 70 75 80
Met Leu Arg Trp Tyr Ala Glu Arg Phe Cys Phe Val Leu Val Thr Thr
85 90 95
Ala Glu Phe Pro Arg Asp Pro Gly Gln Leu Leu Tyr Ile Pro Lys Thr
100 105 110
Tyr Leu Leu Gly Arg Pro Arg Asn Ala Ser Leu Pro Glu Leu Pro Glu
115 120 125
Ala Gly Pro Thr Ser Arg Pro Pro Ala Glu Val Thr Gln Leu Lys Gly
130 135 140
Leu Ser His Asn Pro Gly Ala Ser Ala Leu Leu Arg Ser Arg Ala Trp
145 150 155 160
Val Thr Phe Ala Ala Ala Pro Asp Arg Glu Gly Leu Thr Phe Pro Arg
165 170 175
Gly Asp Asp Gly Ala Thr Glu Arg His Pro Asp Gly Arg Arg Asn Ala
180 185 190
Pro Pro Pro Gly Pro Pro Ala Gly Thr Pro Arg His Pro Thr Thr Asn
195 200 205
Leu Ser Ile Ala His Leu His Asn Ala Ser Val Thr Trp Leu Ala Ala
210 215 220
Arg Gly Leu Leu Arg Thr Pro Gly Arg Tyr Val Tyr Leu Ser Pro Ser
225 230 235 240
Ala Ser Thr Trp Pro Val Gly Val Trp Thr Thr Gly Gly Leu Ala Phe
245 250 255
Gly Cys Asp Ala Ala Leu Val Arg Ala Arg Tyr Gly Lys Gly Phe Met
260 265 270
Gly Leu Val Ile Ser Met Arg Asp Ser Pro Pro Ala Glu Ile Ile Val
275 280 285
Val Pro Ala Asp Lys Thr Leu Ala Arg Val Gly Asn Pro Thr Asp Glu
290 295 300
Asn Ala Pro Ala Val Leu Pro Gly Pro Pro Ala Gly Pro Arg Tyr Arg
305 310 315 320
Val Phe Val Leu Gly Ala Pro Thr Pro Ala Asp Asn Gly Ser Ala Leu
325 330 335
Asp Ala Leu Arg Arg Val Ala Gly Tyr Pro Glu Glu Ser Thr Asn Tyr
340 345 350
Ala Gln Tyr Met Ser Arg Ala Tyr Ala Glu Phe Leu Gly Glu Asp Pro
355 360 365
Gly Ser Gly Thr Asp Ala Arg Pro Ser Leu Phe Trp Arg Leu Ala Gly
370 375 380
Leu Leu Ala Ser Ser Gly Phe Ala Phe Val Asn Ala Ala His Ala His
385 390 395 400
Asp Ala Ile Arg Leu Ser Asp Leu Leu Gly Phe Leu Ala His Ser Arg
405 410 415
Val Leu Ala Gly Leu Ala Ala Arg Gly Ala Ala Gly Cys Ala Ala Asp
420 425 430
Ser Val Phe Leu Asn Val Ser Val Leu Asp Pro Ala Ala Arg Leu Arg
435 440 445
Leu Glu Ala Arg Leu Gly His Leu Val Ala Ala Ile Leu Glu Arg Glu
450 455 460
Gln Ser Leu Val Ala His Ala Leu Gly Tyr Gln Leu Ala Phe Val Leu
465 470 475 480
Asp Ser Pro Ala Ala Tyr Gly Ala Val Ala Pro Ser Ala Ala Arg Leu
485 490 495
Ile Asp Ala Leu Tyr Ala Glu Phe Leu Gly Gly Arg Ala Leu Thr Ala
500 505 510
Pro Met Val Arg Arg Ala Leu Phe Tyr Ala Thr Ala Val Leu Arg Ala
515 520 525
Pro Phe Leu Ala Gly Ala Pro Ser Ala Glu Gln Arg Glu Arg Ala Arg
530 535 540
Arg Gly Leu Leu Ile Thr Thr Ala Leu Cys Thr Ser Asp Val Ala Ala
545 550 555 560
Ala Thr His Ala Asp Leu Arg Ala Ala Leu Ala Arg Thr Asp His Gln
565 570 575
Lys Asn Leu Phe Trp Leu Pro Asp His Phe Ser Pro Cys Ala Ala Ser
580 585 590
Leu Arg Phe Asp Leu Ala Glu Gly Gly Phe Ile Leu Asp Ala Leu Ala
595 600 605
Met Ala Thr Arg Ser Asp Ile Pro Ala Asp Val Met Ala Gln Gln Thr
610 615 620
Arg Gly Val Ala Ser Val Leu Thr Arg Trp Ala His Tyr Asn Ala Leu
625 630 635 640
Ile Arg Ala Phe Val Pro Glu Ala Thr His Gln Cys Ser Gly Pro Ser
645 650 655
His Asn Ala Glu Pro Arg Ile Leu Val Pro Ile Thr His Asn Ala Ser
660 665 670
Tyr Val Val Thr His Thr Pro Leu Pro Arg Gly Ile Gly Tyr Lys Leu
675 680 685
Thr Gly Val Asp Val Arg Arg Pro Leu Phe Ile Thr Tyr Leu Thr Ala
690 695 700
Thr Cys Glu Gly His Ala Arg Glu Ile Glu Pro Lys Arg Leu Val Arg
705 710 715 720
Thr Glu Asn Arg Arg Asp Leu Gly Leu Val Gly Ala Val Phe Leu Arg
725 730 735
Tyr Thr Pro Ala Gly Glu Val Met Ser Val Leu Leu Val Asp Thr Asp
740 745 750
Ala Thr Gln Gln Gln Leu Ala Gln Gly Pro Val Ala Gly Thr Pro Asn
755 760 765
Val Phe Ser Ser Asp Val Pro Ser Val Ala Leu Leu Leu Phe Pro Asn
770 775 780
Gly Thr Val Ile His Leu Leu Ala Phe Asp Thr Leu Pro Ile Ala Thr
785 790 795 800
Ile Ala Pro Gly Phe Leu Ala Ala Ser Ala Leu Gly Val Val Met Ile
805 810 815
Thr Ala Ala Leu Ala Gly Ile Leu Arg Val Val Arg Thr Cys Val Pro
820 825 830
Phe Leu Trp Arg Arg Glu
835
<210> 543
<211> 675
<212> DNA
<213> Simplexvirus Herpes simplex virus type 2
<400> 543
atggggttcg tctgtctgtt tgggcttgtc gttatgggag cctggggggc gtggggtggg 60
tcacaggcaa ccgaatatgt tcttcgtagt gttattgcca aagaggtggg ggacatacta 120
agagtgcctt gcatgcggac ccccgcggac gatgtttctt ggcgctacga ggccccgtcc 180
gttattgact atgcccgcat agacggaata tttcttcgct atcactgccc ggggttggac 240
acgtttttgt gggataggca cgcccagagg gcgtatctgg ttaacccctt tctctttgcg 300
gcgggatttt tggaggactt gagtcactct gtgtttccgg ccgacaccca ggaaacaacg 360
acgcgccggg ccctttataa agagatacgc gatgcgttgg gcagtcgaaa acaggccgtc 420
agccacgcac ccgtcagggc cgggtgtgta aactttgact actcacgcac tcgccgctgc 480
gtcgggcgac gcgatttacg gcctgccaac accacgtcaa cgtgggaacc gcctgtgtcg 540
tcggacgatg aagcgagctc gcagtcgaag cccctcgcca cccagccgcc cgtcctcgcc 600
ctttcgaacg cccccccacg gcgggtctcc ccgacgcgag gtcggcgccg gcatactcgc 660
ctccgacgca actag 675
<210> 544
<211> 224
<212> PRT
<213> Simplexvirus Herpes simplex virus type 2
<400> 544
Met Gly Phe Val Cys Leu Phe Gly Leu Val Val Met Gly Ala Trp Gly
1 5 10 15
Ala Trp Gly Gly Ser Gln Ala Thr Glu Tyr Val Leu Arg Ser Val Ile
20 25 30
Ala Lys Glu Val Gly Asp Ile Leu Arg Val Pro Cys Met Arg Thr Pro
35 40 45
Ala Asp Asp Val Ser Trp Arg Tyr Glu Ala Pro Ser Val Ile Asp Tyr
50 55 60
Ala Arg Ile Asp Gly Ile Phe Leu Arg Tyr His Cys Pro Gly Leu Asp
65 70 75 80
Thr Phe Leu Trp Asp Arg His Ala Gln Arg Ala Tyr Leu Val Asn Pro
85 90 95
Phe Leu Phe Ala Ala Gly Phe Leu Glu Asp Leu Ser His Ser Val Phe
100 105 110
Pro Ala Asp Thr Gln Glu Thr Thr Thr Arg Arg Ala Leu Tyr Lys Glu
115 120 125
Ile Arg Asp Ala Leu Gly Ser Arg Lys Gln Ala Val Ser His Ala Pro
130 135 140
Val Arg Ala Gly Cys Val Asn Phe Asp Tyr Ser Arg Thr Arg Arg Cys
145 150 155 160
Val Gly Arg Arg Asp Leu Arg Pro Ala Asn Thr Thr Ser Thr Trp Glu
165 170 175
Pro Pro Val Ser Ser Asp Asp Glu Ala Ser Ser Gln Ser Lys Pro Leu
180 185 190
Ala Thr Gln Pro Pro Val Leu Ala Leu Ser Asn Ala Pro Pro Arg Arg
195 200 205
Val Ser Pro Thr Arg Gly Arg Arg Arg His Thr Arg Leu Arg Arg Asn
210 215 220
<210> 545
<211> 2607
<212> DNA
<213> Varicellovirus Varicella virus
<400> 545
atgtttgtta cggcggttgt gtcggtctct ccaagctcgt tttatgagag tttacaagta 60
gagcccacac aatcagaaga tataacccgg tctgctcatc tgggcgatgg tgatgaaatc 120
agagaagcta tacacaagtc ccaggacgcc gaaacaaaac ccacgtttta cgtctgccca 180
ccgccaacag gctccacaat cgtacgatta gaaccaactc ggacatgtcc ggattatcac 240
cttggtaaaa actttacaga gggtattgct gttgtttata aagaaaacat tgcagcgtac 300
aagtttaagg cgacggtata ttacaaagat gttatcgtta gcacggcgtg ggccggaagt 360
tcttatacgc aaattactaa tagatatgcg gatagggtac caattcccgt ttcagagatc 420
acggacacca ttgataagtt tggcaagtgt tcttctaaag caacgtacgt acgaaataac 480
cacaaagttg aagcctttaa tgaggataaa aatccacagg atatgcctct aatcgcatca 540
aaatataatt ctgtgggatc caaagcatgg catactacca atgacacgta catggttgcc 600
ggaacccccg gaacatatag gacgggcacg tcggtgaatt gcatcattga ggaagttgaa 660
gccagatcaa tattccctta tgatagtttt ggactttcca cgggagatat aatatacatg 720
tccccgtttt ttggcctacg ggatggtgca tacagagaac attccaatta tgcaatggat 780
cgttttcacc agtttgaggg ttatagacaa agggatcttg acactagagc attactggaa 840
cctgcagcgc ggaacttttt agtcacgcct catttaacgg ttggttggaa ctggaagcca 900
aaacgaacgg aagtttgttc gcttgtcaag tggcgtgagg ttgaagacgt agttcgcgat 960
gagtatgcac acaattttcg ctttacaatg aaaacacttt ctaccacgtt tataagtgaa 1020
acaaacgagt ttaatcttaa ccaaatccat ctcagtcaat gtgtaaagga ggaagcccgg 1080
gctattatta accggatcta tacaaccaga tacaactcat ctcatgttag aaccggggat 1140
atccagacct accttgccag aggggggttt gttgtggtgt ttcaacccct gctgagcaat 1200
tccctcgccc gtctctatct ccaagaattg gtccgtgaaa acactaatca ttcaccacaa 1260
aaacacccga ctcgaaatac cagatcccga cgaagcgtgc cagttgagtt gcgtgccaat 1320
agaacaataa caaccacctc atcggtggaa tttgctatgc tccagtttac atatgaccac 1380
attcaagagc atgttaatga aatgttggca cgtatctcct cgtcgtggtg ccagctacaa 1440
aatcgcgaac gcgccctttg gagcggacta tttccaatta acccaagtgc tttagcgagc 1500
accattttgg atcaacgtgt taaagctcgt attctcggcg acgttatctc cgtttctaat 1560
tgtccagaac tgggatcaga tacacgcatt atacttcaaa actctatgag ggtatctggt 1620
agtactacgc gttgttatag ccgtccttta atttcaatag ttagtttaaa tgggtccggg 1680
acggtggagg gccagcttgg aacagataac gagttaatta tgtccagaga tctgttagaa 1740
ccatgcgtgg ctaatcacaa gcgatatttt ctatttgggc atcactacgt atattatgag 1800
gattatcgtt acgtccgtga aatcgcagtc catgatgtgg gaatgattag cacttacgta 1860
gatttaaact taacacttct taaagataga gagtttatgc cgctgcaagt atatacaaga 1920
gacgagctgc gggatacagg attactagac tacagtgaaa ttcaacgccg aaatcaaatg 1980
cattcgctgc gtttttatga catagacaag gttgtgcaat atgatagcgg aacggccatt 2040
atgcagggca tggctcagtt tttccaggga cttgggaccg cgggccaggc cgttggacat 2100
gtggttcttg gggccacggg agcgctgctt tccaccgtac acggatttac cacgttttta 2160
tctaacccat ttggggcatt ggccgtggga ttattggttt tggcgggact ggtagcggcc 2220
ttttttgcgt accggtacgt gcttaaactt aaaacaagcc cgatgaaggc attatatcca 2280
ctcacaacca aggggttaaa acagttaccg gaaggaatgg atccctttgc cgagaaaccc 2340
aacgctactg ataccccaat agaagaaatt ggcgactcac aaaacactga accgtcggta 2400
aatagcgggt ttgatcccga taaatttcga gaagcccagg aaatgattaa atatatgacg 2460
ttagtatctg cggctgagcg ccaagaatct aaagcccgca aaaaaaataa gactagcgcc 2520
cttttaactt cacgtcttac cggccttgct ttacgaaatc gccgaggata ctcccgtgtt 2580
cgcaccgaga atgtaacggg ggtgtaa 2607
<210> 546
<211> 868
<212> PRT
<213> Varicellovirus Varicella virus
<400> 546
Met Phe Val Thr Ala Val Val Ser Val Ser Pro Ser Ser Phe Tyr Glu
1 5 10 15
Ser Leu Gln Val Glu Pro Thr Gln Ser Glu Asp Ile Thr Arg Ser Ala
20 25 30
His Leu Gly Asp Gly Asp Glu Ile Arg Glu Ala Ile His Lys Ser Gln
35 40 45
Asp Ala Glu Thr Lys Pro Thr Phe Tyr Val Cys Pro Pro Pro Thr Gly
50 55 60
Ser Thr Ile Val Arg Leu Glu Pro Thr Arg Thr Cys Pro Asp Tyr His
65 70 75 80
Leu Gly Lys Asn Phe Thr Glu Gly Ile Ala Val Val Tyr Lys Glu Asn
85 90 95
Ile Ala Ala Tyr Lys Phe Lys Ala Thr Val Tyr Tyr Lys Asp Val Ile
100 105 110
Val Ser Thr Ala Trp Ala Gly Ser Ser Tyr Thr Gln Ile Thr Asn Arg
115 120 125
Tyr Ala Asp Arg Val Pro Ile Pro Val Ser Glu Ile Thr Asp Thr Ile
130 135 140
Asp Lys Phe Gly Lys Cys Ser Ser Lys Ala Thr Tyr Val Arg Asn Asn
145 150 155 160
His Lys Val Glu Ala Phe Asn Glu Asp Lys Asn Pro Gln Asp Met Pro
165 170 175
Leu Ile Ala Ser Lys Tyr Asn Ser Val Gly Ser Lys Ala Trp His Thr
180 185 190
Thr Asn Asp Thr Tyr Met Val Ala Gly Thr Pro Gly Thr Tyr Arg Thr
195 200 205
Gly Thr Ser Val Asn Cys Ile Ile Glu Glu Val Glu Ala Arg Ser Ile
210 215 220
Phe Pro Tyr Asp Ser Phe Gly Leu Ser Thr Gly Asp Ile Ile Tyr Met
225 230 235 240
Ser Pro Phe Phe Gly Leu Arg Asp Gly Ala Tyr Arg Glu His Ser Asn
245 250 255
Tyr Ala Met Asp Arg Phe His Gln Phe Glu Gly Tyr Arg Gln Arg Asp
260 265 270
Leu Asp Thr Arg Ala Leu Leu Glu Pro Ala Ala Arg Asn Phe Leu Val
275 280 285
Thr Pro His Leu Thr Val Gly Trp Asn Trp Lys Pro Lys Arg Thr Glu
290 295 300
Val Cys Ser Leu Val Lys Trp Arg Glu Val Glu Asp Val Val Arg Asp
305 310 315 320
Glu Tyr Ala His Asn Phe Arg Phe Thr Met Lys Thr Leu Ser Thr Thr
325 330 335
Phe Ile Ser Glu Thr Asn Glu Phe Asn Leu Asn Gln Ile His Leu Ser
340 345 350
Gln Cys Val Lys Glu Glu Ala Arg Ala Ile Ile Asn Arg Ile Tyr Thr
355 360 365
Thr Arg Tyr Asn Ser Ser His Val Arg Thr Gly Asp Ile Gln Thr Tyr
370 375 380
Leu Ala Arg Gly Gly Phe Val Val Val Phe Gln Pro Leu Leu Ser Asn
385 390 395 400
Ser Leu Ala Arg Leu Tyr Leu Gln Glu Leu Val Arg Glu Asn Thr Asn
405 410 415
His Ser Pro Gln Lys His Pro Thr Arg Asn Thr Arg Ser Arg Arg Ser
420 425 430
Val Pro Val Glu Leu Arg Ala Asn Arg Thr Ile Thr Thr Thr Ser Ser
435 440 445
Val Glu Phe Ala Met Leu Gln Phe Thr Tyr Asp His Ile Gln Glu His
450 455 460
Val Asn Glu Met Leu Ala Arg Ile Ser Ser Ser Trp Cys Gln Leu Gln
465 470 475 480
Asn Arg Glu Arg Ala Leu Trp Ser Gly Leu Phe Pro Ile Asn Pro Ser
485 490 495
Ala Leu Ala Ser Thr Ile Leu Asp Gln Arg Val Lys Ala Arg Ile Leu
500 505 510
Gly Asp Val Ile Ser Val Ser Asn Cys Pro Glu Leu Gly Ser Asp Thr
515 520 525
Arg Ile Ile Leu Gln Asn Ser Met Arg Val Ser Gly Ser Thr Thr Arg
530 535 540
Cys Tyr Ser Arg Pro Leu Ile Ser Ile Val Ser Leu Asn Gly Ser Gly
545 550 555 560
Thr Val Glu Gly Gln Leu Gly Thr Asp Asn Glu Leu Ile Met Ser Arg
565 570 575
Asp Leu Leu Glu Pro Cys Val Ala Asn His Lys Arg Tyr Phe Leu Phe
580 585 590
Gly His His Tyr Val Tyr Tyr Glu Asp Tyr Arg Tyr Val Arg Glu Ile
595 600 605
Ala Val His Asp Val Gly Met Ile Ser Thr Tyr Val Asp Leu Asn Leu
610 615 620
Thr Leu Leu Lys Asp Arg Glu Phe Met Pro Leu Gln Val Tyr Thr Arg
625 630 635 640
Asp Glu Leu Arg Asp Thr Gly Leu Leu Asp Tyr Ser Glu Ile Gln Arg
645 650 655
Arg Asn Gln Met His Ser Leu Arg Phe Tyr Asp Ile Asp Lys Val Val
660 665 670
Gln Tyr Asp Ser Gly Thr Ala Ile Met Gln Gly Met Ala Gln Phe Phe
675 680 685
Gln Gly Leu Gly Thr Ala Gly Gln Ala Val Gly His Val Val Leu Gly
690 695 700
Ala Thr Gly Ala Leu Leu Ser Thr Val His Gly Phe Thr Thr Phe Leu
705 710 715 720
Ser Asn Pro Phe Gly Ala Leu Ala Val Gly Leu Leu Val Leu Ala Gly
725 730 735
Leu Val Ala Ala Phe Phe Ala Tyr Arg Tyr Val Leu Lys Leu Lys Thr
740 745 750
Ser Pro Met Lys Ala Leu Tyr Pro Leu Thr Thr Lys Gly Leu Lys Gln
755 760 765
Leu Pro Glu Gly Met Asp Pro Phe Ala Glu Lys Pro Asn Ala Thr Asp
770 775 780
Thr Pro Ile Glu Glu Ile Gly Asp Ser Gln Asn Thr Glu Pro Ser Val
785 790 795 800
Asn Ser Gly Phe Asp Pro Asp Lys Phe Arg Glu Ala Gln Glu Met Ile
805 810 815
Lys Tyr Met Thr Leu Val Ser Ala Ala Glu Arg Gln Glu Ser Lys Ala
820 825 830
Arg Lys Lys Asn Lys Thr Ser Ala Leu Leu Thr Ser Arg Leu Thr Gly
835 840 845
Leu Ala Leu Arg Asn Arg Arg Gly Tyr Ser Arg Val Arg Thr Glu Asn
850 855 860
Val Thr Gly Val
865
<210> 547
<211> 1023
<212> DNA
<213> Varicellovirus Varicella virus
<400> 547
atgcaggctt taggaatcaa gacagaacat tttataatta tgtgtctact tagcggacat 60
gctgttttta ccctatggta taccgctcgt gtaaagtttg aacatgagtg tgtgtatgca 120
accacggtga ttaatggtgg accggttgta tgggggtctt ataacaactc tcttatatat 180
gtaacgtttg taaaccactc aacgtttttg gatggcctat ctggatacga ttacagctgc 240
cgggaaaatc tattatcagg agatactatg gtaaaaaccg ctatttctac acctttgcat 300
gacaaaattc gaattgttct gggaacacgt aattgtcacg cttatttttg gtgcgtgcag 360
ctaaaaatga ttttttttgc atggtttgta tatggtatgt atttacaatt tcgacgaata 420
cgtcgtatgt ttgggccatt ccgatcatcc tgtgagttaa tatcccccac atcatattca 480
ctgaattacg taacacgggt tatttcgaac attcttcttg gttacccata tacaaagttg 540
gcaaggttgt tatgtgatgt ttccatgcga cgggatggta tgagtaaagt atttaatgct 600
gaccctataa gttttttata tatgcataaa ggtgttacgt tattgatgct tttggaggtt 660
atcgctcata tatcatctgg atgtattgtg cttttaacgc ttggcgttgc atatacacca 720
tgcgcgttat tataccccac atacattcgg attctggcct gggttgttgt atgcacgctc 780
gctatagtag agcttatatc ttatgttaga ccaaaaccaa ccaaggataa tcatttaaat 840
catatcaata cggggggaat acgtggtata tgcacaacat gttgcgctac agtaatgtcc 900
ggccttgcta taaaatgttt ttatatcgtc atatttgcta tagcagtggt tatttttatg 960
cattacgaac aaagggtgca ggtaagcttg tttggggaaa gtgaaaactc ccagaagcat 1020
taa 1023
<210> 548
<211> 340
<212> PRT
<213> Varicellovirus Varicella virus
<400> 548
Met Gln Ala Leu Gly Ile Lys Thr Glu His Phe Ile Ile Met Cys Leu
1 5 10 15
Leu Ser Gly His Ala Val Phe Thr Leu Trp Tyr Thr Ala Arg Val Lys
20 25 30
Phe Glu His Glu Cys Val Tyr Ala Thr Thr Val Ile Asn Gly Gly Pro
35 40 45
Val Val Trp Gly Ser Tyr Asn Asn Ser Leu Ile Tyr Val Thr Phe Val
50 55 60
Asn His Ser Thr Phe Leu Asp Gly Leu Ser Gly Tyr Asp Tyr Ser Cys
65 70 75 80
Arg Glu Asn Leu Leu Ser Gly Asp Thr Met Val Lys Thr Ala Ile Ser
85 90 95
Thr Pro Leu His Asp Lys Ile Arg Ile Val Leu Gly Thr Arg Asn Cys
100 105 110
His Ala Tyr Phe Trp Cys Val Gln Leu Lys Met Ile Phe Phe Ala Trp
115 120 125
Phe Val Tyr Gly Met Tyr Leu Gln Phe Arg Arg Ile Arg Arg Met Phe
130 135 140
Gly Pro Phe Arg Ser Ser Cys Glu Leu Ile Ser Pro Thr Ser Tyr Ser
145 150 155 160
Leu Asn Tyr Val Thr Arg Val Ile Ser Asn Ile Leu Leu Gly Tyr Pro
165 170 175
Tyr Thr Lys Leu Ala Arg Leu Leu Cys Asp Val Ser Met Arg Arg Asp
180 185 190
Gly Met Ser Lys Val Phe Asn Ala Asp Pro Ile Ser Phe Leu Tyr Met
195 200 205
His Lys Gly Val Thr Leu Leu Met Leu Leu Glu Val Ile Ala His Ile
210 215 220
Ser Ser Gly Cys Ile Val Leu Leu Thr Leu Gly Val Ala Tyr Thr Pro
225 230 235 240
Cys Ala Leu Leu Tyr Pro Thr Tyr Ile Arg Ile Leu Ala Trp Val Val
245 250 255
Val Cys Thr Leu Ala Ile Val Glu Leu Ile Ser Tyr Val Arg Pro Lys
260 265 270
Pro Thr Lys Asp Asn His Leu Asn His Ile Asn Thr Gly Gly Ile Arg
275 280 285
Gly Ile Cys Thr Thr Cys Cys Ala Thr Val Met Ser Gly Leu Ala Ile
290 295 300
Lys Cys Phe Tyr Ile Val Ile Phe Ala Ile Ala Val Val Ile Phe Met
305 310 315 320
His Tyr Glu Gln Arg Val Gln Val Ser Leu Phe Gly Glu Ser Glu Asn
325 330 335
Ser Gln Lys His
340
<210> 549
<211> 2526
<212> DNA
<213> Varicellovirus Varicella virus
<400> 549
atgtttgcgc tagttttagc ggtggtaatt cttcctcttt ggaccacggc taataaatct 60
tacgtaacac caacccctgc gactcgctct atcggacata tgtctgctct tctacgagaa 120
tattccgacc gtaatatgtc tctgaaatta gaagcctttt atcctactgg tttcgatgaa 180
gaactcatta aatcacttca ctggggaaat gatagaaaac acgttttctt ggttattgtt 240
aaggttaacc ctacaacaca cgaaggagac gtcgggctgg ttatatttcc aaaatacttg 300
ttatcgccat accatttcaa agcagaacat cgagcaccgt ttcctgctgg acgttttgga 360
tttcttagtc accctgtgac acccgacgtg agcttctttg acagttcgtt tgcgccgtat 420
ttaactacgc aacatcttgt tgcgtttact acgttcccac caaaccccct tgtatggcat 480
ttggaaagag ctgagaccgc agcaactgca gaaaggccgt ttggggtaag tcttttaccc 540
gctcgcccaa cagtccccaa gaatactatt ctggaacata aagcgcattt tgctacatgg 600
gatgcccttg cccgacatac ttttttttct gccgaagcaa ttatcaccaa ctcaacgttg 660
agaatacacg ttcccctttt tgggtcggta tggccaattc gatactgggc caccggttcg 720
gtgcttctca caagcgactc gggtcgtgtg gaagtaaata ttggtgtagg atttatgagc 780
tcgctcattt ctttatcctc tggaccaccg atagaattaa ttgttgtacc acatacagta 840
aaactgaacg cggttacaag cgacaccaca tggttccagc taaatccacc gggtccggat 900
ccggggccat cttatcgagt ttatttactt ggacgtgggt tggatatgaa tttttcaaag 960
catgctacgg tcgatatatg cgcatatccc gaagagagtt tggattaccg ctatcattta 1020
tccatggccc acacggaggc tctgcggatg acaacgaagg cggatcaaca tgacataaac 1080
gaggaaagct attaccatat cgccgcaaga atagccacat caatttttgc gttgtcggaa 1140
atgggccgta ccacagaata ttttctgtta gatgagatcg tagatgttca gtatcaatta 1200
aaattcctta attacatttt aatgcggata ggagcaggag ctcatcccaa cactatatcc 1260
ggaacctcgg atctgatctt tgccgatcca tcgcagcttc atgacgaact ttcacttctt 1320
tttggtcagg taaaacccgc aaatgtcgat tattttattt catatgatga agcccgtgat 1380
caactaaaga ccgcatacgc gctttcccgt ggtcaagacc atgtgaatgc actttctctc 1440
gccaggcgtg ttataatgag catatacaag gggctgcttg tgaagcaaaa tttaaatgct 1500
acagagaggc aggctttatt ttttgcctca atgattttat taaatttccg cgaaggacta 1560
gaaaattcat ctcgggtatt agacggtcgc acaactttgc ttttaatgac atccatgtgt 1620
acggcagctc acgccacgca agcagcactt aacatacaag aaggcctggc atacttaaat 1680
ccttcaaaac acatgtttac aataccaaac gtatacagtc cttgtatggg ttcccttcgt 1740
acagacctca cggaagagat tcatgttatg aatctcctgt cggcaatacc aacacgccca 1800
ggacttaacg aggtattgca tacccaacta gacgaatctg aaatattcga cgcggcattt 1860
aaaaccatga tgatttttac cacatggact gccaaagatt tgcatatact ccacacccat 1920
gtaccagaag tatttacgtg tcaagatgca gccgcgcgta acggagaata tgtgctcatt 1980
cttccagctg tccagggaca cagttatgtg attacacgaa acaaacctca aaggggtttg 2040
gtatattccc tggcagatgt ggatgtatat aaccccatat ccgttgttta tttaagcagg 2100
gatacttgcg tgtctgaaca tggtgtcata gagacggtcg cactgcccca tccggacaat 2160
ttaaaagaat gtttgtattg cggaagtgtt tttcttaggt atctaaccac gggggcgatt 2220
atggatataa ttattattga cagcaaagat acagaacgac aactagccgc tatgggaaac 2280
tccacaattc cacccttcaa tccagacatg cacggggatg actctaaggc tgtgttgttg 2340
tttccaaacg gaactgtggt aacgcttcta ggattcgaac gacgacaagc catacgaatg 2400
tcgggacaat accttggggc ctctttagga ggggcgtttc tggcggtagt ggggtttggt 2460
attatcggat ggatgttatg tggaaattcc cgccttcgag aatataataa aatacctctg 2520
acataa 2526
<210> 550
<211> 841
<212> PRT
<213> Varicellovirus Varicella virus
<400> 550
Met Phe Ala Leu Val Leu Ala Val Val Ile Leu Pro Leu Trp Thr Thr
1 5 10 15
Ala Asn Lys Ser Tyr Val Thr Pro Thr Pro Ala Thr Arg Ser Ile Gly
20 25 30
His Met Ser Ala Leu Leu Arg Glu Tyr Ser Asp Arg Asn Met Ser Leu
35 40 45
Lys Leu Glu Ala Phe Tyr Pro Thr Gly Phe Asp Glu Glu Leu Ile Lys
50 55 60
Ser Leu His Trp Gly Asn Asp Arg Lys His Val Phe Leu Val Ile Val
65 70 75 80
Lys Val Asn Pro Thr Thr His Glu Gly Asp Val Gly Leu Val Ile Phe
85 90 95
Pro Lys Tyr Leu Leu Ser Pro Tyr His Phe Lys Ala Glu His Arg Ala
100 105 110
Pro Phe Pro Ala Gly Arg Phe Gly Phe Leu Ser His Pro Val Thr Pro
115 120 125
Asp Val Ser Phe Phe Asp Ser Ser Phe Ala Pro Tyr Leu Thr Thr Gln
130 135 140
His Leu Val Ala Phe Thr Thr Phe Pro Pro Asn Pro Leu Val Trp His
145 150 155 160
Leu Glu Arg Ala Glu Thr Ala Ala Thr Ala Glu Arg Pro Phe Gly Val
165 170 175
Ser Leu Leu Pro Ala Arg Pro Thr Val Pro Lys Asn Thr Ile Leu Glu
180 185 190
His Lys Ala His Phe Ala Thr Trp Asp Ala Leu Ala Arg His Thr Phe
195 200 205
Phe Ser Ala Glu Ala Ile Ile Thr Asn Ser Thr Leu Arg Ile His Val
210 215 220
Pro Leu Phe Gly Ser Val Trp Pro Ile Arg Tyr Trp Ala Thr Gly Ser
225 230 235 240
Val Leu Leu Thr Ser Asp Ser Gly Arg Val Glu Val Asn Ile Gly Val
245 250 255
Gly Phe Met Ser Ser Leu Ile Ser Leu Ser Ser Gly Pro Pro Ile Glu
260 265 270
Leu Ile Val Val Pro His Thr Val Lys Leu Asn Ala Val Thr Ser Asp
275 280 285
Thr Thr Trp Phe Gln Leu Asn Pro Pro Gly Pro Asp Pro Gly Pro Ser
290 295 300
Tyr Arg Val Tyr Leu Leu Gly Arg Gly Leu Asp Met Asn Phe Ser Lys
305 310 315 320
His Ala Thr Val Asp Ile Cys Ala Tyr Pro Glu Glu Ser Leu Asp Tyr
325 330 335
Arg Tyr His Leu Ser Met Ala His Thr Glu Ala Leu Arg Met Thr Thr
340 345 350
Lys Ala Asp Gln His Asp Ile Asn Glu Glu Ser Tyr Tyr His Ile Ala
355 360 365
Ala Arg Ile Ala Thr Ser Ile Phe Ala Leu Ser Glu Met Gly Arg Thr
370 375 380
Thr Glu Tyr Phe Leu Leu Asp Glu Ile Val Asp Val Gln Tyr Gln Leu
385 390 395 400
Lys Phe Leu Asn Tyr Ile Leu Met Arg Ile Gly Ala Gly Ala His Pro
405 410 415
Asn Thr Ile Ser Gly Thr Ser Asp Leu Ile Phe Ala Asp Pro Ser Gln
420 425 430
Leu His Asp Glu Leu Ser Leu Leu Phe Gly Gln Val Lys Pro Ala Asn
435 440 445
Val Asp Tyr Phe Ile Ser Tyr Asp Glu Ala Arg Asp Gln Leu Lys Thr
450 455 460
Ala Tyr Ala Leu Ser Arg Gly Gln Asp His Val Asn Ala Leu Ser Leu
465 470 475 480
Ala Arg Arg Val Ile Met Ser Ile Tyr Lys Gly Leu Leu Val Lys Gln
485 490 495
Asn Leu Asn Ala Thr Glu Arg Gln Ala Leu Phe Phe Ala Ser Met Ile
500 505 510
Leu Leu Asn Phe Arg Glu Gly Leu Glu Asn Ser Ser Arg Val Leu Asp
515 520 525
Gly Arg Thr Thr Leu Leu Leu Met Thr Ser Met Cys Thr Ala Ala His
530 535 540
Ala Thr Gln Ala Ala Leu Asn Ile Gln Glu Gly Leu Ala Tyr Leu Asn
545 550 555 560
Pro Ser Lys His Met Phe Thr Ile Pro Asn Val Tyr Ser Pro Cys Met
565 570 575
Gly Ser Leu Arg Thr Asp Leu Thr Glu Glu Ile His Val Met Asn Leu
580 585 590
Leu Ser Ala Ile Pro Thr Arg Pro Gly Leu Asn Glu Val Leu His Thr
595 600 605
Gln Leu Asp Glu Ser Glu Ile Phe Asp Ala Ala Phe Lys Thr Met Met
610 615 620
Ile Phe Thr Thr Trp Thr Ala Lys Asp Leu His Ile Leu His Thr His
625 630 635 640
Val Pro Glu Val Phe Thr Cys Gln Asp Ala Ala Ala Arg Asn Gly Glu
645 650 655
Tyr Val Leu Ile Leu Pro Ala Val Gln Gly His Ser Tyr Val Ile Thr
660 665 670
Arg Asn Lys Pro Gln Arg Gly Leu Val Tyr Ser Leu Ala Asp Val Asp
675 680 685
Val Tyr Asn Pro Ile Ser Val Val Tyr Leu Ser Arg Asp Thr Cys Val
690 695 700
Ser Glu His Gly Val Ile Glu Thr Val Ala Leu Pro His Pro Asp Asn
705 710 715 720
Leu Lys Glu Cys Leu Tyr Cys Gly Ser Val Phe Leu Arg Tyr Leu Thr
725 730 735
Thr Gly Ala Ile Met Asp Ile Ile Ile Ile Asp Ser Lys Asp Thr Glu
740 745 750
Arg Gln Leu Ala Ala Met Gly Asn Ser Thr Ile Pro Pro Phe Asn Pro
755 760 765
Asp Met His Gly Asp Asp Ser Lys Ala Val Leu Leu Phe Pro Asn Gly
770 775 780
Thr Val Val Thr Leu Leu Gly Phe Glu Arg Arg Gln Ala Ile Arg Met
785 790 795 800
Ser Gly Gln Tyr Leu Gly Ala Ser Leu Gly Gly Ala Phe Leu Ala Val
805 810 815
Val Gly Phe Gly Ile Ile Gly Trp Met Leu Cys Gly Asn Ser Arg Leu
820 825 830
Arg Glu Tyr Asn Lys Ile Pro Leu Thr
835 840
<210> 551
<211> 483
<212> DNA
<213> Varicellovirus Varicella virus
<400> 551
atggcatcac ataaatggtt actgcagatg atagtttttt taaaaactat cacaatcgcg 60
tattgtcttc atctccaaga cgacactccg ttgttttttg gagccaaacc gctatcggat 120
gtgagtttga ttataacgga accgtgcgtg tcatcggtat atgaggcgtg ggactatgcg 180
gcacccccgg tatcaaacct cagcgaggcg ctatcgggaa tcgtggttaa gacaaaatgt 240
ccagtaccgg aagttatact ttggtttaaa gacaaacaaa tggcgtactg gacaaatcca 300
tacgtcacct taaaggggct gacacaatct gttggtgaag aacataaaag cggggacata 360
cgcgatgctt tgttggatgc cctttccggt gtatgggtag actctactcc atcttccaca 420
aatatcccgg aaaatggatg tgtctgggga gccgaccgtt tgttccaacg cgtatgccaa 480
tga 483
<210> 552
<211> 160
<212> PRT
<213> Varicellovirus Varicella virus
<400> 552
Met Ala Ser His Lys Trp Leu Leu Gln Met Ile Val Phe Leu Lys Thr
1 5 10 15
Ile Thr Ile Ala Tyr Cys Leu His Leu Gln Asp Asp Thr Pro Leu Phe
20 25 30
Phe Gly Ala Lys Pro Leu Ser Asp Val Ser Leu Ile Ile Thr Glu Pro
35 40 45
Cys Val Ser Ser Val Tyr Glu Ala Trp Asp Tyr Ala Ala Pro Pro Val
50 55 60
Ser Asn Leu Ser Glu Ala Leu Ser Gly Ile Val Val Lys Thr Lys Cys
65 70 75 80
Pro Val Pro Glu Val Ile Leu Trp Phe Lys Asp Lys Gln Met Ala Tyr
85 90 95
Trp Thr Asn Pro Tyr Val Thr Leu Lys Gly Leu Thr Gln Ser Val Gly
100 105 110
Glu Glu His Lys Ser Gly Asp Ile Arg Asp Ala Leu Leu Asp Ala Leu
115 120 125
Ser Gly Val Trp Val Asp Ser Thr Pro Ser Ser Thr Asn Ile Pro Glu
130 135 140
Asn Gly Cys Val Trp Gly Ala Asp Arg Leu Phe Gln Arg Val Cys Gln
145 150 155 160
<210> 553
<211> 1341
<212> DNA
<213> Orthohepadnavirus Hepatitis B virus
<400> 553
gccaccatgc agttaatcat tacttccaaa ctaggcatta tttacatact ctgtggaagg 60
ctggcattct atataagaga gaaactacac gcagtgcctc attttgtggg tcaccatatt 120
cttgggaaca agagctacag catgggaggt tggtcttcca aacctcgaca aggcatgggg 180
acgaatcttt ctgttcccaa tcctctggga ttctttcccg atcaccagtt ggaccctgcg 240
ttcggagcca actcaaacaa tccagattgg gacttcaacc ccaacaagga tcactggcca 300
gaggcaaagc aggtaggagc gggagcattc gggccagggt tcaccccacc acacggcggc 360
cttttggggt ggagccctca ggctcagggc acattgacaa cagtgccagc agcgcctcct 420
cctgcttcca ccaatcggca gtcaggaaga cagcctactc ccatctctcc acctctaaga 480
gacagtcatc ctcaggccat gcagtggaac tccacaacat tccaccaagc tctgctagat 540
ccaagagtga ggggcctcta tttccctgct ggtggctcca gttccggaac agtaaaccct 600
gttccgacta ctgcctcacc catatcgtca atcttctcga ggactgggga ccctgcaccg 660
aacatggaga gcacaacatc aggattccta ggacccctgc tcgtgttaca ggcggggttt 720
ttcttgttga caagaatcct cacaatacca cagagtctag actcgtggtt gacttctctc 780
aattttctag ggggaacacc caagtgtcct ggccaaaatt cgcagtcccc aacctccaat 840
cactcaccaa cctcttgtcc tccaacttgt cctggctatc gctggatgtg tctgcggcgt 900
tttatcatat tcctcttcat cctgctgcta tgcctcatct tcttgttggt tcttctggac 960
tacaaaggta tgttgcccgt ttgtcctcta cttccaggaa catcaactac cagcacggga 1020
ccatgcaaga cctgcacgat tcctgctcaa aacacctcta tgtttccctc ttgttgctgt 1080
acaaaacctt cggacggaaa ctgcacttgt attcccatcc catcatcctg ggctttcgca 1140
agattcctat gggagtgggc ctcagtccgt ttctcctggc tcagtttact agtgccattt 1200
gttcagtggt ctgcagggct ttcccccact gtttggcttt cagttatatg gacgatgtgg 1260
tattgggggc caagtctgta caacatcttg agtccctttt tacctctatt accaatttta 1320
tgttgtcttt gggcatacat t 1341
<210> 554
<211> 445
<212> PRT
<213> Orthohepadnavirus Hepatitis B virus
<400> 554
Met Gln Leu Ile Ile Thr Ser Lys Leu Gly Ile Ile Tyr Ile Leu Cys
1 5 10 15
Gly Arg Leu Ala Phe Tyr Ile Arg Glu Lys Leu His Ala Val Pro His
20 25 30
Phe Val Gly His His Ile Leu Gly Asn Lys Ser Tyr Ser Met Gly Gly
35 40 45
Trp Ser Ser Lys Pro Arg Gln Gly Met Gly Thr Asn Leu Ser Val Pro
50 55 60
Asn Pro Leu Gly Phe Phe Pro Asp His Gln Leu Asp Pro Ala Phe Gly
65 70 75 80
Ala Asn Ser Asn Asn Pro Asp Trp Asp Phe Asn Pro Asn Lys Asp His
85 90 95
Trp Pro Glu Ala Lys Gln Val Gly Ala Gly Ala Phe Gly Pro Gly Phe
100 105 110
Thr Pro Pro His Gly Gly Leu Leu Gly Trp Ser Pro Gln Ala Gln Gly
115 120 125
Thr Leu Thr Thr Val Pro Ala Ala Pro Pro Pro Ala Ser Thr Asn Arg
130 135 140
Gln Ser Gly Arg Gln Pro Thr Pro Ile Ser Pro Pro Leu Arg Asp Ser
145 150 155 160
His Pro Gln Ala Met Gln Trp Asn Ser Thr Thr Phe His Gln Ala Leu
165 170 175
Leu Asp Pro Arg Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser
180 185 190
Ser Gly Thr Val Asn Pro Val Pro Thr Thr Ala Ser Pro Ile Ser Ser
195 200 205
Ile Phe Ser Arg Thr Gly Asp Pro Ala Pro Asn Met Glu Ser Thr Thr
210 215 220
Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu
225 230 235 240
Leu Thr Arg Ile Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Leu Thr
245 250 255
Ser Leu Asn Phe Leu Gly Gly Thr Pro Lys Cys Pro Gly Gln Asn Ser
260 265 270
Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser Cys Pro Pro Thr Cys
275 280 285
Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe
290 295 300
Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Lys
305 310 315 320
Gly Met Leu Pro Val Cys Pro Leu Leu Pro Gly Thr Ser Thr Thr Ser
325 330 335
Thr Gly Pro Cys Lys Thr Cys Thr Ile Pro Ala Gln Asn Thr Ser Met
340 345 350
Phe Pro Ser Cys Cys Cys Thr Lys Pro Ser Asp Gly Asn Cys Thr Cys
355 360 365
Ile Pro Ile Pro Ser Ser Trp Ala Phe Ala Arg Phe Leu Trp Glu Trp
370 375 380
Ala Ser Val Arg Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln
385 390 395 400
Trp Ser Ala Gly Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Thr
405 410 415
Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asn Ile Leu Ser Pro Phe Leu
420 425 430
Pro Leu Leu Pro Ile Leu Cys Cys Leu Trp Ala Tyr Ile
435 440 445
<210> 555
<211> 849
<212> DNA
<213> Orthohepadnavirus Hepatitis B virus
<400> 555
gccaccatgc agtggaactc cacgacgttc catcaggcgt tgcaggatcc tcgcgtgagg 60
ggactctact ttccggccgg gggctcctct agtggcacag tcaatcctgt gcccacaacg 120
gcaagcttga tttcctcaat cttttcacgc atcggcgacc cagcaccgaa catggagtct 180
attacttctg gtttcctggg ccccctcctc gtgttgcaag ccggtttctt cctcctgacc 240
aaaatactca ccatacccca gtctctggat agttggtgga cgagcctgaa tttccttggt 300
ggagctcccg tttgcctcgg tcagaatagc caatcaccca cttccaacca ctcacctacg 360
tcctgtccac ctatctgccc tggataccgc tggatgtgct tgcggcggtt tataattttc 420
ctcttcatcc tccttttatg tctgattttt ctcctggttt tgctggatta ccagggtatg 480
ctgcctgtgt gtcccctcat cccaggaagc agcacgacct ctactggtcc atgccgcacc 540
tgcatgactc tggctcaggg aacttccatg tttccgtcct gttgttgctc caagccttct 600
gatgggaatt gcacttgtat acctatccct agtagttggg ccttcgggaa gttcttgtgg 660
gagtgggcgt cagcccgttt ctcctggctg agcttgttag taccttttgt ccaatggttc 720
gcaggcctgt ctccaacagt gtggttatcc gtgatttgga tgatgtggta ttggggccct 780
agcctctatg atatcctgag tccttttatc cctctgctgc caatcttctt ttgcctttgg 840
gtgtacatc 849
<210> 556
<211> 281
<212> PRT
<213> Orthohepadnavirus Hepatitis B virus
<400> 556
Met Gln Trp Asn Ser Thr Thr Phe His Gln Ala Leu Gln Asp Pro Arg
1 5 10 15
Val Arg Gly Leu Tyr Phe Pro Ala Gly Gly Ser Ser Ser Gly Thr Val
20 25 30
Asn Pro Val Pro Thr Thr Ala Ser Leu Ile Ser Ser Ile Phe Ser Arg
35 40 45
Ile Gly Asp Pro Ala Pro Asn Met Glu Ser Ile Thr Ser Gly Phe Leu
50 55 60
Gly Pro Leu Leu Val Leu Gln Ala Gly Phe Phe Leu Leu Thr Lys Ile
65 70 75 80
Leu Thr Ile Pro Gln Ser Leu Asp Ser Trp Trp Thr Ser Leu Asn Phe
85 90 95
Leu Gly Gly Ala Pro Val Cys Leu Gly Gln Asn Ser Gln Ser Pro Thr
100 105 110
Ser Asn His Ser Pro Thr Ser Cys Pro Pro Ile Cys Pro Gly Tyr Arg
115 120 125
Trp Met Cys Leu Arg Arg Phe Ile Ile Phe Leu Phe Ile Leu Leu Leu
130 135 140
Cys Leu Ile Phe Leu Leu Val Leu Leu Asp Tyr Gln Gly Met Leu Pro
145 150 155 160
Val Cys Pro Leu Ile Pro Gly Ser Ser Thr Thr Ser Thr Gly Pro Cys
165 170 175
Arg Thr Cys Met Thr Leu Ala Gln Gly Thr Ser Met Phe Pro Ser Cys
180 185 190
Cys Cys Ser Lys Pro Ser Asp Gly Asn Cys Thr Cys Ile Pro Ile Pro
195 200 205
Ser Ser Trp Ala Phe Gly Lys Phe Leu Trp Glu Trp Ala Ser Ala Arg
210 215 220
Phe Ser Trp Leu Ser Leu Leu Val Pro Phe Val Gln Trp Phe Ala Gly
225 230 235 240
Leu Ser Pro Thr Val Trp Leu Ser Val Ile Trp Met Met Trp Tyr Trp
245 250 255
Gly Pro Ser Leu Tyr Asp Ile Leu Ser Pro Phe Ile Pro Leu Leu Pro
260 265 270
Ile Phe Phe Cys Leu Trp Val Tyr Ile
275 280
<210> 557
<211> 684
<212> DNA
<213> Orthohepadnavirus Hepatitis B virus
<400> 557
gccaccatgg aaagcattac ttccggcttt ctcggcccgt tactggtgct tcaggctgga 60
ttctttctgc tcaccaaaat ccttacaatt ccacagtctc ttgattcatg gtggactagt 120
ttgaattttc tggggggagc accagtctgc ctgggtcaga actcccagtc tccgacaagt 180
aaccatagcc caaccagttg tcctccgata tgccccggct ataggtggat gtgtcttcgc 240
cgcttcatta ttttcctgtt cattttgctt ctttgcttaa tctttctgct tgtgcttctg 300
gactaccagg gtatgcttcc tgtatgcccg ctgatccctg gttcatcaac cacgtccacc 360
gggccttgcc ggacttgcat gactttggcc caggggactt ctatgttccc aagctgttgc 420
tgttcaaaac cctccgacgg gaactgtacc tgtatcccca ttccttccag ttgggccttt 480
ggaaaattcc tctgggagtg ggcttccgca cggttcagct ggctttcact gcttgttcca 540
tttgtacagt ggtttgccgg gctgtctcct accgtgtggc tcagcgttat atggatgatg 600
tggtattggg gaccatcact ctacgacatt ctgtccccat tcatcccact gttgcctatt 660
ttcttttgct tatgggtata catc 684
<210> 558
<211> 226
<212> PRT
<213> Orthohepadnavirus Hepatitis B virus
<400> 558
Met Glu Ser Ile Thr Ser Gly Phe Leu Gly Pro Leu Leu Val Leu Gln
1 5 10 15
Ala Gly Phe Phe Leu Leu Thr Lys Ile Leu Thr Ile Pro Gln Ser Leu
20 25 30
Asp Ser Trp Trp Thr Ser Leu Asn Phe Leu Gly Gly Ala Pro Val Cys
35 40 45
Leu Gly Gln Asn Ser Gln Ser Pro Thr Ser Asn His Ser Pro Thr Ser
50 55 60
Cys Pro Pro Ile Cys Pro Gly Tyr Arg Trp Met Cys Leu Arg Arg Phe
65 70 75 80
Ile Ile Phe Leu Phe Ile Leu Leu Leu Cys Leu Ile Phe Leu Leu Val
85 90 95
Leu Leu Asp Tyr Gln Gly Met Leu Pro Val Cys Pro Leu Ile Pro Gly
100 105 110
Ser Ser Thr Thr Ser Thr Gly Pro Cys Arg Thr Cys Met Thr Leu Ala
115 120 125
Gln Gly Thr Ser Met Phe Pro Ser Cys Cys Cys Ser Lys Pro Ser Asp
130 135 140
Gly Asn Cys Thr Cys Ile Pro Ile Pro Ser Ser Trp Ala Phe Gly Lys
145 150 155 160
Phe Leu Trp Glu Trp Ala Ser Ala Arg Phe Ser Trp Leu Ser Leu Leu
165 170 175
Val Pro Phe Val Gln Trp Phe Ala Gly Leu Ser Pro Thr Val Trp Leu
180 185 190
Ser Val Ile Trp Met Met Trp Tyr Trp Gly Pro Ser Leu Tyr Asp Ile
195 200 205
Leu Ser Pro Phe Ile Pro Leu Leu Pro Ile Phe Phe Cys Leu Trp Val
210 215 220
Tyr Ile
225
<210> 559
<211> 2949
<212> DNA
<213> Alphavirus Eastern equine encephalitis virus
<400> 559
atgtcgctcg ccactgtcat gtgcgtcctg gccaatatca cgtttccatg tgatcaacca 60
ccctgcatgc catgctgtta tgaaaagaat ccacacgaaa cactcaccat gctggaacag 120
aattacgaca gccgagccta tgatcagctg ctcgatgccg ctgtgaaatg taatgctagg 180
agaaccagga gagatttgga cactcatttc acccagtata agttggcacg cccgtatatt 240
gctgattgcc ctaactgtgg gcatagtcgg tgcgacagcc ctatagctat agaagaagtc 300
agaggggatg cgcatgcagg agtcatccgc atccagacat cagctatgtt tggtctgaag 360
acggatggag tcgatttggc ctacatgagt ttcatgaacg gcaaaacgca gaaatcaata 420
aagatcgaca acctgcatgt gcgcacctca gccccttgtt ccctcgtgtc gcaccacggc 480
tattacatct tggctcaatg cccaccaggg gacacggtta cagttgggtt tcacgacggg 540
cctaaccgcc atacgtgcac agttgcccat aaggtagaat tcaggccagt gggtagagag 600
aaataccgtc acccacctga acatggagtt gaattaccgt gtaaccgtta cactcacaag 660
cgtgcagacc aaggacacta tgttgagatg catcaaccag ggctagttgc cgaccactct 720
ctccttagca tccacagtgc caaggtgaaa attacggtac cgagcggcgc ccaagtgaaa 780
tactactgca agtgtccaga tgtacgagag ggaattacca gcagcgacca tacaaccacc 840
tgcacggatg tcaaacaatg cagggcttac ctgattgaca acaagaaatg ggtgtacaac 900
tctggaagac tgcctcgagg agagggcgac acttttaaag gaaaacttca tgtgcccttt 960
gtgcctgtta aggccaagtg catcgccacg ctggcaccgg agcctctagt tgagcacaaa 1020
caccgcaccc tgattttaca cctgcacccg gaccacccga ccttgctgac gaccaggtca 1080
cttggaagtg atgcaaatcc aactcgacaa tggattgagc gaccaacaac tgtcaatttc 1140
acagtcaccg gagaagggtt ggagtatacc tggggaaacc atccaccaaa aagagtatgg 1200
gctcaagagt caggagaagg gaacccacat ggatggccgc acgaagtggt agtctattac 1260
tacaacagat acccgctaac cacaattatc gggttatgca cctgtgtggc tatcatcatg 1320
gtctcttgtg tcacatccgt gtggctcctt tgcaggactc gcaatctttg cataaccccg 1380
tataaactag ccccgaacgc tcaagtccca atactcctgg cgttactttg ctgcattaag 1440
ccgacgaggg cagacgacac cttgcaagtg ctgaattatc tgtggaacaa caatcaaaac 1500
tttttctgga tgcagacgct tatcccactt gcagcgctta tcgtatgcat gcgcatgctg 1560
cgttgcttat tttgctgtgg gccggctttt ttacttgtct gcggcgcctt gggcgccgca 1620
gcgtacgaac acacagcagt gatgccgaac aaggtgggga tcccgtataa agctttagtc 1680
gaacgcccag ggtatgcacc cgttcaccta cagatacagc tggttaatac caggataatt 1740
ccatcaacta acctggagta catcacctgc aagtacaaga caaaagtgcc gtctccagta 1800
gtgaaatgct gcggtgccac tcaatgtacc tctaaacccc atcctgacta tcagtgtcag 1860
gtgtttacag gtgtttaccc attcatgtgg ggaggagcct actgcttctg cgacaccgaa 1920
aacacccaga tgagcgaggc gtatgtagag cgctcggaag agtgctctat cgaccacgca 1980
aaagcttata aagtacacac aggcactgtt caggcaatgg tgaacataac ttatgggagc 2040
gtcagctgga gatctgcaga tgtctacgtc aatggtgaaa ctcccgcgaa aataggagat 2100
gccaaactca tcataggtcc actgtcatct gcgtggtccc cattcgataa caaggtggtg 2160
gtttatgggc atgaagtgta taattacgac tttcctgagt acagcaccgg caaagcaggc 2220
tctttcggag acctgcaatc acgcacatca accagcaacg atctgtacgc aaataccaac 2280
ttgaagctac aacgacccca ggctggtatc gtgcacacac ctttcaccca ggcgccctct 2340
ggcttcgaac gatggaaaag ggacaaaggg gcaccgttga acgacgtagc cccgtttggc 2400
tgttcaattg ccctggagcc gctccgtgca gaaaattgtg cagtgggaag catccctata 2460
tctatagata tacccgatgc ggctttcacc agaatatctg aaacaccgac agtctcagac 2520
ctggaatgca aaattacgga gtgtacttat gcctccgatt tcggtggtat agccaccgtt 2580
gcctacaaat ccagtaaagc aggaaactgt ccaattcatt ctccatcggg tgttgcagtt 2640
attaaagaga atgacgtcac ccttgctgag agcggatcat ttacattcca cttctccact 2700
gcaaacatcc atcctgcttt taagctgcag gtctgcacca gtgcagttac ctgcaaagga 2760
gattgcaagc caccgaaaga tcatatcgtc gattatccag cacaacatac cgaatccttt 2820
acgtcggcga tatccgccac cgcgtggtcg tggctaaaag tgctggtagg aggaacatca 2880
gcatttattg ttctggggct tattgctaca gcagtggttg ccctagttct gttcttccat 2940
agacattaa 2949
<210> 560
<211> 982
<212> PRT
<213> Alphavirus Eastern equine encephalitis virus
<400> 560
Met Ser Leu Ala Thr Val Met Cys Val Leu Ala Asn Ile Thr Phe Pro
1 5 10 15
Cys Asp Gln Pro Pro Cys Met Pro Cys Cys Tyr Glu Lys Asn Pro His
20 25 30
Glu Thr Leu Thr Met Leu Glu Gln Asn Tyr Asp Ser Arg Ala Tyr Asp
35 40 45
Gln Leu Leu Asp Ala Ala Val Lys Cys Asn Ala Arg Arg Thr Arg Arg
50 55 60
Asp Leu Asp Thr His Phe Thr Gln Tyr Lys Leu Ala Arg Pro Tyr Ile
65 70 75 80
Ala Asp Cys Pro Asn Cys Gly His Ser Arg Cys Asp Ser Pro Ile Ala
85 90 95
Ile Glu Glu Val Arg Gly Asp Ala His Ala Gly Val Ile Arg Ile Gln
100 105 110
Thr Ser Ala Met Phe Gly Leu Lys Thr Asp Gly Val Asp Leu Ala Tyr
115 120 125
Met Ser Phe Met Asn Gly Lys Thr Gln Lys Ser Ile Lys Ile Asp Asn
130 135 140
Leu His Val Arg Thr Ser Ala Pro Cys Ser Leu Val Ser His His Gly
145 150 155 160
Tyr Tyr Ile Leu Ala Gln Cys Pro Pro Gly Asp Thr Val Thr Val Gly
165 170 175
Phe His Asp Gly Pro Asn Arg His Thr Cys Thr Val Ala His Lys Val
180 185 190
Glu Phe Arg Pro Val Gly Arg Glu Lys Tyr Arg His Pro Pro Glu His
195 200 205
Gly Val Glu Leu Pro Cys Asn Arg Tyr Thr His Lys Arg Ala Asp Gln
210 215 220
Gly His Tyr Val Glu Met His Gln Pro Gly Leu Val Ala Asp His Ser
225 230 235 240
Leu Leu Ser Ile His Ser Ala Lys Val Lys Ile Thr Val Pro Ser Gly
245 250 255
Ala Gln Val Lys Tyr Tyr Cys Lys Cys Pro Asp Val Arg Glu Gly Ile
260 265 270
Thr Ser Ser Asp His Thr Thr Thr Cys Thr Asp Val Lys Gln Cys Arg
275 280 285
Ala Tyr Leu Ile Asp Asn Lys Lys Trp Val Tyr Asn Ser Gly Arg Leu
290 295 300
Pro Arg Gly Glu Gly Asp Thr Phe Lys Gly Lys Leu His Val Pro Phe
305 310 315 320
Val Pro Val Lys Ala Lys Cys Ile Ala Thr Leu Ala Pro Glu Pro Leu
325 330 335
Val Glu His Lys His Arg Thr Leu Ile Leu His Leu His Pro Asp His
340 345 350
Pro Thr Leu Leu Thr Thr Arg Ser Leu Gly Ser Asp Ala Asn Pro Thr
355 360 365
Arg Gln Trp Ile Glu Arg Pro Thr Thr Val Asn Phe Thr Val Thr Gly
370 375 380
Glu Gly Leu Glu Tyr Thr Trp Gly Asn His Pro Pro Lys Arg Val Trp
385 390 395 400
Ala Gln Glu Ser Gly Glu Gly Asn Pro His Gly Trp Pro His Glu Val
405 410 415
Val Val Tyr Tyr Tyr Asn Arg Tyr Pro Leu Thr Thr Ile Ile Gly Leu
420 425 430
Cys Thr Cys Val Ala Ile Ile Met Val Ser Cys Val Thr Ser Val Trp
435 440 445
Leu Leu Cys Arg Thr Arg Asn Leu Cys Ile Thr Pro Tyr Lys Leu Ala
450 455 460
Pro Asn Ala Gln Val Pro Ile Leu Leu Ala Leu Leu Cys Cys Ile Lys
465 470 475 480
Pro Thr Arg Ala Asp Asp Thr Leu Gln Val Leu Asn Tyr Leu Trp Asn
485 490 495
Asn Asn Gln Asn Phe Phe Trp Met Gln Thr Leu Ile Pro Leu Ala Ala
500 505 510
Leu Ile Val Cys Met Arg Met Leu Arg Cys Leu Phe Cys Cys Gly Pro
515 520 525
Ala Phe Leu Leu Val Cys Gly Ala Leu Gly Ala Ala Ala Tyr Glu His
530 535 540
Thr Ala Val Met Pro Asn Lys Val Gly Ile Pro Tyr Lys Ala Leu Val
545 550 555 560
Glu Arg Pro Gly Tyr Ala Pro Val His Leu Gln Ile Gln Leu Val Asn
565 570 575
Thr Arg Ile Ile Pro Ser Thr Asn Leu Glu Tyr Ile Thr Cys Lys Tyr
580 585 590
Lys Thr Lys Val Pro Ser Pro Val Val Lys Cys Cys Gly Ala Thr Gln
595 600 605
Cys Thr Ser Lys Pro His Pro Asp Tyr Gln Cys Gln Val Phe Thr Gly
610 615 620
Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Thr Glu
625 630 635 640
Asn Thr Gln Met Ser Glu Ala Tyr Val Glu Arg Ser Glu Glu Cys Ser
645 650 655
Ile Asp His Ala Lys Ala Tyr Lys Val His Thr Gly Thr Val Gln Ala
660 665 670
Met Val Asn Ile Thr Tyr Gly Ser Val Ser Trp Arg Ser Ala Asp Val
675 680 685
Tyr Val Asn Gly Glu Thr Pro Ala Lys Ile Gly Asp Ala Lys Leu Ile
690 695 700
Ile Gly Pro Leu Ser Ser Ala Trp Ser Pro Phe Asp Asn Lys Val Val
705 710 715 720
Val Tyr Gly His Glu Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Ser Thr
725 730 735
Gly Lys Ala Gly Ser Phe Gly Asp Leu Gln Ser Arg Thr Ser Thr Ser
740 745 750
Asn Asp Leu Tyr Ala Asn Thr Asn Leu Lys Leu Gln Arg Pro Gln Ala
755 760 765
Gly Ile Val His Thr Pro Phe Thr Gln Ala Pro Ser Gly Phe Glu Arg
770 775 780
Trp Lys Arg Asp Lys Gly Ala Pro Leu Asn Asp Val Ala Pro Phe Gly
785 790 795 800
Cys Ser Ile Ala Leu Glu Pro Leu Arg Ala Glu Asn Cys Ala Val Gly
805 810 815
Ser Ile Pro Ile Ser Ile Asp Ile Pro Asp Ala Ala Phe Thr Arg Ile
820 825 830
Ser Glu Thr Pro Thr Val Ser Asp Leu Glu Cys Lys Ile Thr Glu Cys
835 840 845
Thr Tyr Ala Ser Asp Phe Gly Gly Ile Ala Thr Val Ala Tyr Lys Ser
850 855 860
Ser Lys Ala Gly Asn Cys Pro Ile His Ser Pro Ser Gly Val Ala Val
865 870 875 880
Ile Lys Glu Asn Asp Val Thr Leu Ala Glu Ser Gly Ser Phe Thr Phe
885 890 895
His Phe Ser Thr Ala Asn Ile His Pro Ala Phe Lys Leu Gln Val Cys
900 905 910
Thr Ser Ala Val Thr Cys Lys Gly Asp Cys Lys Pro Pro Lys Asp His
915 920 925
Ile Val Asp Tyr Pro Ala Gln His Thr Glu Ser Phe Thr Ser Ala Ile
930 935 940
Ser Ala Thr Ala Trp Ser Trp Leu Lys Val Leu Val Gly Gly Thr Ser
945 950 955 960
Ala Phe Ile Val Leu Gly Leu Ile Ala Thr Ala Val Val Ala Leu Val
965 970 975
Leu Phe Phe His Arg His
980
<210> 561
<211> 2946
<212> DNA
<213> Alphavirus Venezuelan equine encephalitis virus
<400> 561
atgtcactag tgaccactat gtgcctgctc gccaatgtga cgttcccatg tgccgaacca 60
ccaatttgct acgacagaaa accagcagag actttggcca tgctcagcgt taacgttgac 120
aacccgggct acgatgagct actggaagca gctgttaagt gccccggaag aaaaaggaga 180
tctaccaagg agctgtttaa ggagtataag ctaacgcgcc cttacatggc cagatgcatc 240
agatgtgccg ttgggagctg ccatagtcca atagcaattg aggcagtgaa gagcgacggg 300
cacgacggct atgttagact tcagacttcc tcgcagtatg gcctggattc ctctggcaac 360
ttaaagggaa ggactatgcg gtatgatatg cacgggacca ttgaagagat accactacat 420
caagtgtcac tccacacatc tcgcccgtgt cacattgtgg atgggcatgg ttattttctg 480
cttgctaggt gcccggcagg ggactccatc accatggaat ttaagaaagg ttcagtcaca 540
cactcctgct cagtgccgta tgaagtgaaa tttaatcctg taggcagaga actctacact 600
catccaccag aacacggagc agagcaagcg tgccaagtct acgcgcacga tgcacagaac 660
agaggagctt atgtcgagat gcacctcccg ggctcagaag tggacagcag tttgatttcc 720
ttgagcggca gttcagtcac cgtgacacct cctgtcggga ctagcgcctt ggtggaatgc 780
aagtgcggcg gcacaaagat ctccgaaacc atcaacaagg caaaacagtt cagccagtgc 840
acaaagaagg agcagtgcag agcatatcga ctgcagaatg acaagtgggt gtataattct 900
gacaaactgc ccaaagcagc gggagccacc ctaaaaggaa aactacacgt cccgttcttg 960
ctggcagacg gcaaatgcac cgtgcctcta gcaccggaac ctatgataac cttcggtttc 1020
cgatcagtgt cactgaaact gcaccctaag aatcccacat atctgaccac tcgccaactt 1080
gctgatgagc ctcattacac gcacgagctc atatctgaac cagctgttag gaattttacc 1140
gtcactgaaa aggggtggga gtttgtatgg ggaaaccatc cgccgaaaag gttttgggca 1200
caggaaacag cacccggaaa tccacatggg ctgccacatg aggtgataac tcattattac 1260
cacagatacc ctatgtccac catcctgggt ttgtcaattt gcgccgccat tgtaaccgtt 1320
tccgttgcag cgtccacctg gctgttttgc aaatccagag tttcgtgcct aactccttac 1380
cggctaacac ctaacgccag gatgccgctt tgcctggccg tgctttgctg cgcccgcact 1440
gcccgggccg agaccacctg ggagtccttg gatcacctat ggaacaataa ccaacagatg 1500
ttctggattc aattgctgat ccctctggcc gccttgattg tagtgactcg cctgctcaag 1560
tgcgtgtgct gtgtagtgcc ttttttagtc gtggccggcg ccgcaggcgc cggcgcctac 1620
gagcacgcga ccacgatgcc gagccaagcg ggaatctcgt ataacaccat agtcaacaga 1680
gcaggctacg cgccactccc tatcagcata acaccaacaa agatcaagct gatacccaca 1740
gtgaacttgg agtacgtcac ctgccactac aaaacaggaa tggattcacc agccatcaaa 1800
tgctgcggat ctcaggaatg tactccaact aacaggcctg atgaacagtg caaagtcttc 1860
acaggggttt acccgttcat gtggggaggt gcatattgct tttgcgacac tgagaatact 1920
caggtcagca aggcctacgt aatgaaatct gacgactgcc ttgcggatca tgctgaagca 1980
tacaaagcgc acacagcctc agtgcaggcg ttcctcaaca tcacagtggg ggaacactct 2040
attgtgacca ccgtgtatgt gaatggagaa actcctgtga acttcaatgg ggtcaaacta 2100
actgcaggtc cactttccac agcttggaca ccctttgaca gaaaaatcgt gcagtatgcc 2160
ggggagatct ataattacga ttttcctgag tatggggcag gacaaccagg agcatttgga 2220
gacatacaat ccagaacagt ctcaagctca gatctgtatg ccaataccaa cctagtgctg 2280
cagagaccca aagcaggagc gatccatgtg ccatacactc aggcaccatc gggttttgag 2340
caatggaaga aagataaagc tccgtcattg aaattcaccg cccctttcgg atgcgaaata 2400
tatacaaacc ccattcgcgc cgaaaattgt gctgtagggt caattccatt agcctttgac 2460
attcccgacg ccttgttcac cagggtgtca gaaacaccga cactttcagc ggccgaatgc 2520
actcttaacg agtgcgtgta ttcatccgac tttggcggga tcgccacggt caagtattcg 2580
gccagcaagt caggcaagtg cgcagtccat gtgccatcag ggactgctac cctaaaagaa 2640
gcagcagtcg agctaaccga gcaagggtcg gcgaccattc atttctcgac cgcaaatatc 2700
cacccggagt tcaggctcca aatatgcaca tcatatgtca cgtgcaaagg tgattgtcac 2760
cccccgaaag accacattgt gacacacccc cagtatcacg cccaaacatt tacagccgcg 2820
gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcggc cgtaattatt 2880
ataattggct tagtgctggc tactattgtg gccatgtacg tgctgaccaa ccagaaacat 2940
aattga 2946
<210> 562
<211> 981
<212> PRT
<213> Alphavirus Venezuelan equine encephalitis virus
<400> 562
Met Ser Leu Val Thr Thr Met Cys Leu Leu Ala Asn Val Thr Phe Pro
1 5 10 15
Cys Ala Glu Pro Pro Ile Cys Tyr Asp Arg Lys Pro Ala Glu Thr Leu
20 25 30
Ala Met Leu Ser Val Asn Val Asp Asn Pro Gly Tyr Asp Glu Leu Leu
35 40 45
Glu Ala Ala Val Lys Cys Pro Gly Arg Lys Arg Arg Ser Thr Lys Glu
50 55 60
Leu Phe Lys Glu Tyr Lys Leu Thr Arg Pro Tyr Met Ala Arg Cys Ile
65 70 75 80
Arg Cys Ala Val Gly Ser Cys His Ser Pro Ile Ala Ile Glu Ala Val
85 90 95
Lys Ser Asp Gly His Asp Gly Tyr Val Arg Leu Gln Thr Ser Ser Gln
100 105 110
Tyr Gly Leu Asp Ser Ser Gly Asn Leu Lys Gly Arg Thr Met Arg Tyr
115 120 125
Asp Met His Gly Thr Ile Glu Glu Ile Pro Leu His Gln Val Ser Leu
130 135 140
His Thr Ser Arg Pro Cys His Ile Val Asp Gly His Gly Tyr Phe Leu
145 150 155 160
Leu Ala Arg Cys Pro Ala Gly Asp Ser Ile Thr Met Glu Phe Lys Lys
165 170 175
Gly Ser Val Thr His Ser Cys Ser Val Pro Tyr Glu Val Lys Phe Asn
180 185 190
Pro Val Gly Arg Glu Leu Tyr Thr His Pro Pro Glu His Gly Ala Glu
195 200 205
Gln Ala Cys Gln Val Tyr Ala His Asp Ala Gln Asn Arg Gly Ala Tyr
210 215 220
Val Glu Met His Leu Pro Gly Ser Glu Val Asp Ser Ser Leu Ile Ser
225 230 235 240
Leu Ser Gly Ser Ser Val Thr Val Thr Pro Pro Val Gly Thr Ser Ala
245 250 255
Leu Val Glu Cys Lys Cys Gly Gly Thr Lys Ile Ser Glu Thr Ile Asn
260 265 270
Lys Ala Lys Gln Phe Ser Gln Cys Thr Lys Lys Glu Gln Cys Arg Ala
275 280 285
Tyr Arg Leu Gln Asn Asp Lys Trp Val Tyr Asn Ser Asp Lys Leu Pro
290 295 300
Lys Ala Ala Gly Ala Thr Leu Lys Gly Lys Leu His Val Pro Phe Leu
305 310 315 320
Leu Ala Asp Gly Lys Cys Thr Val Pro Leu Ala Pro Glu Pro Met Ile
325 330 335
Thr Phe Gly Phe Arg Ser Val Ser Leu Lys Leu His Pro Lys Asn Pro
340 345 350
Thr Tyr Leu Thr Thr Arg Gln Leu Ala Asp Glu Pro His Tyr Thr His
355 360 365
Glu Leu Ile Ser Glu Pro Ala Val Arg Asn Phe Thr Val Thr Glu Lys
370 375 380
Gly Trp Glu Phe Val Trp Gly Asn His Pro Pro Lys Arg Phe Trp Ala
385 390 395 400
Gln Glu Thr Ala Pro Gly Asn Pro His Gly Leu Pro His Glu Val Ile
405 410 415
Thr His Tyr Tyr His Arg Tyr Pro Met Ser Thr Ile Leu Gly Leu Ser
420 425 430
Ile Cys Ala Ala Ile Val Thr Val Ser Val Ala Ala Ser Thr Trp Leu
435 440 445
Phe Cys Lys Ser Arg Val Ser Cys Leu Thr Pro Tyr Arg Leu Thr Pro
450 455 460
Asn Ala Arg Met Pro Leu Cys Leu Ala Val Leu Cys Cys Ala Arg Thr
465 470 475 480
Ala Arg Ala Glu Thr Thr Trp Glu Ser Leu Asp His Leu Trp Asn Asn
485 490 495
Asn Gln Gln Met Phe Trp Ile Gln Leu Leu Ile Pro Leu Ala Ala Leu
500 505 510
Ile Val Val Thr Arg Leu Leu Lys Cys Val Cys Cys Val Val Pro Phe
515 520 525
Leu Val Val Ala Gly Ala Ala Gly Ala Gly Ala Tyr Glu His Ala Thr
530 535 540
Thr Met Pro Ser Gln Ala Gly Ile Ser Tyr Asn Thr Ile Val Asn Arg
545 550 555 560
Ala Gly Tyr Ala Pro Leu Pro Ile Ser Ile Thr Pro Thr Lys Ile Lys
565 570 575
Leu Ile Pro Thr Val Asn Leu Glu Tyr Val Thr Cys His Tyr Lys Thr
580 585 590
Gly Met Asp Ser Pro Ala Ile Lys Cys Cys Gly Ser Gln Glu Cys Thr
595 600 605
Pro Thr Asn Arg Pro Asp Glu Gln Cys Lys Val Phe Thr Gly Val Tyr
610 615 620
Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Thr Glu Asn Thr
625 630 635 640
Gln Val Ser Lys Ala Tyr Val Met Lys Ser Asp Asp Cys Leu Ala Asp
645 650 655
His Ala Glu Ala Tyr Lys Ala His Thr Ala Ser Val Gln Ala Phe Leu
660 665 670
Asn Ile Thr Val Gly Glu His Ser Ile Val Thr Thr Val Tyr Val Asn
675 680 685
Gly Glu Thr Pro Val Asn Phe Asn Gly Val Lys Leu Thr Ala Gly Pro
690 695 700
Leu Ser Thr Ala Trp Thr Pro Phe Asp Arg Lys Ile Val Gln Tyr Ala
705 710 715 720
Gly Glu Ile Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly Ala Gly Gln Pro
725 730 735
Gly Ala Phe Gly Asp Ile Gln Ser Arg Thr Val Ser Ser Ser Asp Leu
740 745 750
Tyr Ala Asn Thr Asn Leu Val Leu Gln Arg Pro Lys Ala Gly Ala Ile
755 760 765
His Val Pro Tyr Thr Gln Ala Pro Ser Gly Phe Glu Gln Trp Lys Lys
770 775 780
Asp Lys Ala Pro Ser Leu Lys Phe Thr Ala Pro Phe Gly Cys Glu Ile
785 790 795 800
Tyr Thr Asn Pro Ile Arg Ala Glu Asn Cys Ala Val Gly Ser Ile Pro
805 810 815
Leu Ala Phe Asp Ile Pro Asp Ala Leu Phe Thr Arg Val Ser Glu Thr
820 825 830
Pro Thr Leu Ser Ala Ala Glu Cys Thr Leu Asn Glu Cys Val Tyr Ser
835 840 845
Ser Asp Phe Gly Gly Ile Ala Thr Val Lys Tyr Ser Ala Ser Lys Ser
850 855 860
Gly Lys Cys Ala Val His Val Pro Ser Gly Thr Ala Thr Leu Lys Glu
865 870 875 880
Ala Ala Val Glu Leu Thr Glu Gln Gly Ser Ala Thr Ile His Phe Ser
885 890 895
Thr Ala Asn Ile His Pro Glu Phe Arg Leu Gln Ile Cys Thr Ser Tyr
900 905 910
Val Thr Cys Lys Gly Asp Cys His Pro Pro Lys Asp His Ile Val Thr
915 920 925
His Pro Gln Tyr His Ala Gln Thr Phe Thr Ala Ala Val Ser Lys Thr
930 935 940
Ala Trp Thr Trp Leu Thr Ser Leu Leu Gly Gly Ser Ala Val Ile Ile
945 950 955 960
Ile Ile Gly Leu Val Leu Ala Thr Ile Val Ala Met Tyr Val Leu Thr
965 970 975
Asn Gln Lys His Asn
980
<210> 563
<211> 2937
<212> DNA
<213> Alphavirus Western equine encephalitis virus
<400> 563
atgtcactag ttacagcact gtgcgtgctt tcgaatgtta cgttcccatg cgataaacca 60
cccgtgtgct attcactggc gccagaacga acactcgacg tgctcgagga gaacgtcaac 120
aatccaaatt acgacacgct gctggagaac gtcttgaaat gtccgtcacg ccggcccaaa 180
cgaagcatta ccgatgactt cacactgacc agtccctacc tagggttctg cccgtattgc 240
agacactcag cgccgtgttt cagcccaata aaaattgaga acgtgtggga cgaatctgat 300
gatggatcga ttagaatcca ggtctcggca caattcggct atgatcaggc aggcactgca 360
gatgtcacca aattccgtta catgtcttac gaccacgacc atgacatcaa ggaagacagt 420
gtgaagaaaa tagctattag tacatctgga ccctgccgtc gtcttggcca caaagggtac 480
ttcctgttag ctcaatgtcc tccaggtgac agtgtaaccg tcagtatcac gagcggagca 540
tctgagaatt catgcaccgt ggagaaaaag atcaggagga agtttgtcgg tagagaggag 600
tacttgttcc cacctgtcca tggaaagctg gtaaagtgcc acgtttacga tcacttgaag 660
gagacgtctg ccggatacat aaccatgcac aggccaggcc cacacgcgta taagtcctat 720
ctggaggaag cgtcaggcga agtgtacatt aaaccacctt ctggcaagaa cgtcacctac 780
gaatgtaagt gtggcgacta cagcacaggt attgtgagca cgcgaacgaa gatgaacggc 840
tgcaccaaag caaaacagtg cattgcctac aagagcgacc aaacgaaatg ggtctacaac 900
tcgccggatc ttattaggca cacagaccac tcagtgcaag gtaaactgca cattccattc 960
cgcttgacac cgacattctg cccggttccg ttagctcaca cgcctacagt cacgaagtgg 1020
tttaaaggca tcaccctcca cctgactgca acgcgaccaa cattgctgac aacgagaaaa 1080
ttggggctgc gagcagacgc aacagcagaa tggattacag ggactacatc caggaatttt 1140
tctgtggggc gagaagggct ggagtacgta tggggcaacc atgaaccagt cagagtctgg 1200
gcccaggagt cggcaccagg cgacccgcat ggatggccgc atgagatcat catccactat 1260
tatcatcggc atccagtcta cactgtcatt gtgctgtgcg gtgtcgctct tgctatcctg 1320
gtaggcattg catcgtcagc agcttgtatc gccaaagcaa gaagagactg cctgacgcca 1380
tacgcgcttg caccgaacgc aacggtaccc acagcattag cagttttgtg ctgtattcgg 1440
ccaaccaacg cagaaacatt tggagaaact ttgaatcatc tgtggtttaa caaccaaccg 1500
tttctctggg cacagttgtg catccctctg gcagcgctta ttattctgtt tcgctgcttt 1560
tcatgctgca tgcctttttt attggttgca ggcgtctgcc tggggaaggt agacgccttc 1620
gaacatgcga ccactgtgcc aaatgttccg gggatcccgt ataaggcgtt ggtcgaacgt 1680
gcaggttacg cgccacttaa tctggagatt acggtcgtct catcggaatt aacaccctca 1740
actaacaagg agtatgtgac ctgcaaattc cacacagtca ttccttcacc gcaagttaaa 1800
tgctgcgggt ccctcgagtg taaggcatcc tcaaaagcgg attacacatg ccgcgttttt 1860
ggcggtgtgt accctttcat gtggggaggc gcacagtgct tctgtgacag tgagaacaca 1920
caactgagtg aggcatacgt cgagttcgct ccagactgca ctatagatca tgcagtcgca 1980
ctaaaagttc acacagctgc tctgaaagtc ggcctgcgta tagtatacgg caataccacc 2040
gcgcacctgg atacgttcgt caatggcgtc acgccaggtt cctcacggga cctgaaggtc 2100
atagcagggc cgatatcagc cgctttttca ccctttgacc ataaggtcgt catcagaaag 2160
gggcttgttt ataactacga cttccctgag tatggagcta tgaaaccagg agcgttcggc 2220
gatattcaag catcctcgct tgatgccaca gacatagtag cccgcactga catacggctg 2280
ctgaagcctt ctgtcaagaa catccacgtc ccctacaccc aagcagtatc agggtatgaa 2340
atgtggaaga acaactcagg acgacccctg caagaaacag caccatttgg atgtaaaatt 2400
gaagtggagc ctctgcgagc gtctaattgt gcttatgggc acatccctat ctcgattgac 2460
atccctgatg cagcttttgt gagatcatca gaatcaccaa caattttaga agtcagctgc 2520
acagtagcag actgcattta ttctgcagac tttggtggtt cgctaacact acagtacaaa 2580
gctgacaggg agggacattg tccagttcac tcccactcca ctacagctgt tttgaaggaa 2640
gcgaccacac atgtgactgc cacaggcagc ataacactac attttagcac atcgagccca 2700
caagcaaatt tcatagtttc gctatgcggc aagaagacca cttgcaatgc tgaatgtaaa 2760
ccaccggccg accacataat tggagaacca cataaggtcg accaagaatt ccaggcggca 2820
gtttccaaaa catcttggaa ctggctgctt gcactgtttg ggggagcatc atccctcatt 2880
gctgtaggac ttatagtgtt ggtctgcagc tctatgctta taaacacacg tagatga 2937
<210> 564
<211> 978
<212> PRT
<213> Alphavirus Western equine encephalitis virus
<400> 564
Met Ser Leu Val Thr Ala Leu Cys Val Leu Ser Asn Val Thr Phe Pro
1 5 10 15
Cys Asp Lys Pro Pro Val Cys Tyr Ser Leu Ala Pro Glu Arg Thr Leu
20 25 30
Asp Val Leu Glu Glu Asn Val Asn Asn Pro Asn Tyr Asp Thr Leu Leu
35 40 45
Glu Asn Val Leu Lys Cys Pro Ser Arg Arg Pro Lys Arg Ser Ile Thr
50 55 60
Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly Phe Cys Pro Tyr Cys
65 70 75 80
Arg His Ser Ala Pro Cys Phe Ser Pro Ile Lys Ile Glu Asn Val Trp
85 90 95
Asp Glu Ser Asp Asp Gly Ser Ile Arg Ile Gln Val Ser Ala Gln Phe
100 105 110
Gly Tyr Asp Gln Ala Gly Thr Ala Asp Val Thr Lys Phe Arg Tyr Met
115 120 125
Ser Tyr Asp His Asp His Asp Ile Lys Glu Asp Ser Val Lys Lys Ile
130 135 140
Ala Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu Gly His Lys Gly Tyr
145 150 155 160
Phe Leu Leu Ala Gln Cys Pro Pro Gly Asp Ser Val Thr Val Ser Ile
165 170 175
Thr Ser Gly Ala Ser Glu Asn Ser Cys Thr Val Glu Lys Lys Ile Arg
180 185 190
Arg Lys Phe Val Gly Arg Glu Glu Tyr Leu Phe Pro Pro Val His Gly
195 200 205
Lys Leu Val Lys Cys His Val Tyr Asp His Leu Lys Glu Thr Ser Ala
210 215 220
Gly Tyr Ile Thr Met His Arg Pro Gly Pro His Ala Tyr Lys Ser Tyr
225 230 235 240
Leu Glu Glu Ala Ser Gly Glu Val Tyr Ile Lys Pro Pro Ser Gly Lys
245 250 255
Asn Val Thr Tyr Glu Cys Lys Cys Gly Asp Tyr Ser Thr Gly Ile Val
260 265 270
Ser Thr Arg Thr Lys Met Asn Gly Cys Thr Lys Ala Lys Gln Cys Ile
275 280 285
Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Tyr Asn Ser Pro Asp Leu
290 295 300
Ile Arg His Thr Asp His Ser Val Gln Gly Lys Leu His Ile Pro Phe
305 310 315 320
Arg Leu Thr Pro Thr Phe Cys Pro Val Pro Leu Ala His Thr Pro Thr
325 330 335
Val Thr Lys Trp Phe Lys Gly Ile Thr Leu His Leu Thr Ala Thr Arg
340 345 350
Pro Thr Leu Leu Thr Thr Arg Lys Leu Gly Leu Arg Ala Asp Ala Thr
355 360 365
Ala Glu Trp Ile Thr Gly Thr Thr Ser Arg Asn Phe Ser Val Gly Arg
370 375 380
Glu Gly Leu Glu Tyr Val Trp Gly Asn His Glu Pro Val Arg Val Trp
385 390 395 400
Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly Trp Pro His Glu Ile
405 410 415
Ile Ile His Tyr Tyr His Arg His Pro Val Tyr Thr Val Ile Val Leu
420 425 430
Cys Gly Val Ala Leu Ala Ile Leu Val Gly Ile Ala Ser Ser Ala Ala
435 440 445
Cys Ile Ala Lys Ala Arg Arg Asp Cys Leu Thr Pro Tyr Ala Leu Ala
450 455 460
Pro Asn Ala Thr Val Pro Thr Ala Leu Ala Val Leu Cys Cys Ile Arg
465 470 475 480
Pro Thr Asn Ala Glu Thr Phe Gly Glu Thr Leu Asn His Leu Trp Phe
485 490 495
Asn Asn Gln Pro Phe Leu Trp Ala Gln Leu Cys Ile Pro Leu Ala Ala
500 505 510
Leu Ile Ile Leu Phe Arg Cys Phe Ser Cys Cys Met Pro Phe Leu Leu
515 520 525
Val Ala Gly Val Cys Leu Gly Lys Val Asp Ala Phe Glu His Ala Thr
530 535 540
Thr Val Pro Asn Val Pro Gly Ile Pro Tyr Lys Ala Leu Val Glu Arg
545 550 555 560
Ala Gly Tyr Ala Pro Leu Asn Leu Glu Ile Thr Val Val Ser Ser Glu
565 570 575
Leu Thr Pro Ser Thr Asn Lys Glu Tyr Val Thr Cys Lys Phe His Thr
580 585 590
Val Ile Pro Ser Pro Gln Val Lys Cys Cys Gly Ser Leu Glu Cys Lys
595 600 605
Ala Ser Ser Lys Ala Asp Tyr Thr Cys Arg Val Phe Gly Gly Val Tyr
610 615 620
Pro Phe Met Trp Gly Gly Ala Gln Cys Phe Cys Asp Ser Glu Asn Thr
625 630 635 640
Gln Leu Ser Glu Ala Tyr Val Glu Phe Ala Pro Asp Cys Thr Ile Asp
645 650 655
His Ala Val Ala Leu Lys Val His Thr Ala Ala Leu Lys Val Gly Leu
660 665 670
Arg Ile Val Tyr Gly Asn Thr Thr Ala His Leu Asp Thr Phe Val Asn
675 680 685
Gly Val Thr Pro Gly Ser Ser Arg Asp Leu Lys Val Ile Ala Gly Pro
690 695 700
Ile Ser Ala Ala Phe Ser Pro Phe Asp His Lys Val Val Ile Arg Lys
705 710 715 720
Gly Leu Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly Ala Met Lys Pro
725 730 735
Gly Ala Phe Gly Asp Ile Gln Ala Ser Ser Leu Asp Ala Thr Asp Ile
740 745 750
Val Ala Arg Thr Asp Ile Arg Leu Leu Lys Pro Ser Val Lys Asn Ile
755 760 765
His Val Pro Tyr Thr Gln Ala Val Ser Gly Tyr Glu Met Trp Lys Asn
770 775 780
Asn Ser Gly Arg Pro Leu Gln Glu Thr Ala Pro Phe Gly Cys Lys Ile
785 790 795 800
Glu Val Glu Pro Leu Arg Ala Ser Asn Cys Ala Tyr Gly His Ile Pro
805 810 815
Ile Ser Ile Asp Ile Pro Asp Ala Ala Phe Val Arg Ser Ser Glu Ser
820 825 830
Pro Thr Ile Leu Glu Val Ser Cys Thr Val Ala Asp Cys Ile Tyr Ser
835 840 845
Ala Asp Phe Gly Gly Ser Leu Thr Leu Gln Tyr Lys Ala Asp Arg Glu
850 855 860
Gly His Cys Pro Val His Ser His Ser Thr Thr Ala Val Leu Lys Glu
865 870 875 880
Ala Thr Thr His Val Thr Ala Thr Gly Ser Ile Thr Leu His Phe Ser
885 890 895
Thr Ser Ser Pro Gln Ala Asn Phe Ile Val Ser Leu Cys Gly Lys Lys
900 905 910
Thr Thr Cys Asn Ala Glu Cys Lys Pro Pro Ala Asp His Ile Ile Gly
915 920 925
Glu Pro His Lys Val Asp Gln Glu Phe Gln Ala Ala Val Ser Lys Thr
930 935 940
Ser Trp Asn Trp Leu Leu Ala Leu Phe Gly Gly Ala Ser Ser Leu Ile
945 950 955 960
Ala Val Gly Leu Ile Val Leu Val Cys Ser Ser Met Leu Ile Asn Thr
965 970 975
Arg Arg
<210> 565
<211> 2964
<212> DNA
<213> Alphavirus Semliki Forest virus
<400> 565
atgtccgccc cgctgattac tgccatgtgt gtccttgcca atgctacctt cccgtgcttc 60
cagcccccgt gtgtaccttg ctgctatgaa aacaacgcag aggccacact acggatgctc 120
gaggataacg tggataggcc agggtactac gacctccttc aggcagcctt gacgtgccga 180
aacggaacaa gacaccggcg cagcgtgtcg caacacttca acgtgtataa ggctacacgc 240
ccttacatcg cgtactgcgc cgactgcgga gcagggcact cgtgtcatag ccccgtagca 300
attgaagcgg tcaggtccga agctaccgac gggatgctga agattcagtt ctcggcacaa 360
attggcatag ataagagtga caatcatgac tacacgaaga taaggtacgc agacgggcac 420
gccattgaga atgccgtccg gtcatctttg aaggtagcca cctccggaga ctgtttcgtc 480
catggcacaa tgggacattt catactggca aagtgcccac cgggtgaatt cctgcaggtc 540
tcgatccagg acaccagaaa cgcggtccgt gcctgcagaa tacaatatca tcatgaccct 600
caaccggtgg gtagagaaaa atttacaatt agaccacact atggaaaaga gatcccttgc 660
accacttatc aacagaccac agcggagacc gtggaggaaa tcgacatgca tatgccgcca 720
gatacgccgg acaggacgtt gctatcacag caatctggca atgtaaagat cacagtcgga 780
ggaaagaagg tgaaatacaa ctgcacctgt ggaaccggaa acgttggcac tactaattcg 840
gacatgacga tcaacacgtg tctaatagag cagtgccacg tctcagtgac ggaccataag 900
aaatggcagt tcaactcacc tttcgtcccg agagccgacg aaccggctag aaaaggcaaa 960
gtccatatcc cattcccgtt ggacaacatc acatgcagag ttccaatggc gcgcgaacca 1020
accgtcatcc acggcaaaag agaagtgaca ctgcaccttc acccagatca tcccacgctc 1080
ttttcctacc gcacactggg tgaggacccg cagtatcacg aggaatgggt gacagcggcg 1140
gtggaacgga ccatacccgt accagtggac gggatggagt accactgggg aaacaacgac 1200
ccagtgaggc tttggtctca actcaccact gaagggaaac cgcacggctg gccgcatcag 1260
atcgtacagt actactatgg gctttacccg gccgctacag tatccgcggt cgtcgggatg 1320
agcttactgg cgttgatatc gatcttcgcg tcgtgctaca tgctggttgc ggcccgcagt 1380
aagtgcttga ccccttatgc tttaacacca ggagctgcag ttccgtggac gctggggata 1440
ctctgctgcg ccccgcgggc gcacgcagct agtgtggcag agactatggc ctacttgtgg 1500
gaccaaaacc aagcgttgtt ctggttggag tttgcggccc ctgttgcctg catcctcatc 1560
atcacgtatt gcctcagaaa cgtgctgtgt tgctgtaaga gcctttcttt tttagtgcta 1620
ctgagcctcg gggcaaccgc cagagcttac gaacattcga cagtaatgcc gaacgtggtg 1680
gggttcccgt ataaggctca cattgaaagg ccaggatata gccccctcac tttgcagatg 1740
caggttgttg aaaccagcct cgaaccaacc cttaatttgg aatacataac ctgtgagtac 1800
aagacggtcg tcccgtcgcc gtacgtgaag tgctgcggcg cctcagagtg ctccactaaa 1860
gagaagcctg actaccaatg caaggtttac acaggcgtgt acccgttcat gtggggaggg 1920
gcatattgct tctgcgactc agaaaacacg caactcagcg aggcgtacgt cgatcgatcg 1980
gacgtatgca ggcatgatca cgcatctgct tacaaagccc atacagcatc gctgaaggcc 2040
aaagtgaggg ttatgtacgg caacgtaaac cagactgtgg atgtttacgt gaacggagac 2100
catgccgtca cgataggggg tactcagttc atattcgggc cgctgtcatc ggcctggacc 2160
ccgttcgaca acaagatagt cgtgtacaaa gacgaagtgt tcaatcagga cttcccgccg 2220
tacggatctg ggcaaccagg gcgcttcggc gacatccaaa gcagaacagt ggagagtaac 2280
gacctgtacg cgaacacggc actgaagctg gcacgccctt cacccggcat ggtccatgta 2340
ccgtacacac agacaccttc agggttcaaa tattggctaa aggaaaaagg gacagcccta 2400
aatacgaagg ctccttttgg ctgccaaatc aaaacgaacc ctgtcagggc catgaactgc 2460
gccgtgggaa acatccctgt ctccatgaat ttgcctgaca gcgcctttac ccgcattgtc 2520
gaggcgccga ccatcattga cctgacttgc acagtggcta cctgtacgca ctcctcggat 2580
ttcggcggcg tcttgacact gacgtacaag accaacaaga acggggactg ctctgtacac 2640
tcgcactcta acgtagctac tctacaggag gccacagcaa aagtgaagac agcaggtaag 2700
gtgaccttac acttctccac ggcaagcgca tcaccttctt ttgtggtgtc gctatgcagt 2760
gctagggcca cctgttcagc gtcgtgtgag cccccgaaag accacatagt cccatatgcg 2820
gctagccaca gtaacgtagt gtttccagac atgtcgggca ccgcactatc atgggtgcag 2880
aaaatctcgg gtggtctggg ggccttcgca atcggcgcta tcctggtgct ggttgtggtc 2940
acttgcattg ggctccgcag ataa 2964
<210> 566
<211> 987
<212> PRT
<213> Alphavirus Semliki Forest virus
<400> 566
Met Ser Ala Pro Leu Ile Thr Ala Met Cys Val Leu Ala Asn Ala Thr
1 5 10 15
Phe Pro Cys Phe Gln Pro Pro Cys Val Pro Cys Cys Tyr Glu Asn Asn
20 25 30
Ala Glu Ala Thr Leu Arg Met Leu Glu Asp Asn Val Asp Arg Pro Gly
35 40 45
Tyr Tyr Asp Leu Leu Gln Ala Ala Leu Thr Cys Arg Asn Gly Thr Arg
50 55 60
His Arg Arg Ser Val Ser Gln His Phe Asn Val Tyr Lys Ala Thr Arg
65 70 75 80
Pro Tyr Ile Ala Tyr Cys Ala Asp Cys Gly Ala Gly His Ser Cys His
85 90 95
Ser Pro Val Ala Ile Glu Ala Val Arg Ser Glu Ala Thr Asp Gly Met
100 105 110
Leu Lys Ile Gln Phe Ser Ala Gln Ile Gly Ile Asp Lys Ser Asp Asn
115 120 125
His Asp Tyr Thr Lys Ile Arg Tyr Ala Asp Gly His Ala Ile Glu Asn
130 135 140
Ala Val Arg Ser Ser Leu Lys Val Ala Thr Ser Gly Asp Cys Phe Val
145 150 155 160
His Gly Thr Met Gly His Phe Ile Leu Ala Lys Cys Pro Pro Gly Glu
165 170 175
Phe Leu Gln Val Ser Ile Gln Asp Thr Arg Asn Ala Val Arg Ala Cys
180 185 190
Arg Ile Gln Tyr His His Asp Pro Gln Pro Val Gly Arg Glu Lys Phe
195 200 205
Thr Ile Arg Pro His Tyr Gly Lys Glu Ile Pro Cys Thr Thr Tyr Gln
210 215 220
Gln Thr Thr Ala Glu Thr Val Glu Glu Ile Asp Met His Met Pro Pro
225 230 235 240
Asp Thr Pro Asp Arg Thr Leu Leu Ser Gln Gln Ser Gly Asn Val Lys
245 250 255
Ile Thr Val Gly Gly Lys Lys Val Lys Tyr Asn Cys Thr Cys Gly Thr
260 265 270
Gly Asn Val Gly Thr Thr Asn Ser Asp Met Thr Ile Asn Thr Cys Leu
275 280 285
Ile Glu Gln Cys His Val Ser Val Thr Asp His Lys Lys Trp Gln Phe
290 295 300
Asn Ser Pro Phe Val Pro Arg Ala Asp Glu Pro Ala Arg Lys Gly Lys
305 310 315 320
Val His Ile Pro Phe Pro Leu Asp Asn Ile Thr Cys Arg Val Pro Met
325 330 335
Ala Arg Glu Pro Thr Val Ile His Gly Lys Arg Glu Val Thr Leu His
340 345 350
Leu His Pro Asp His Pro Thr Leu Phe Ser Tyr Arg Thr Leu Gly Glu
355 360 365
Asp Pro Gln Tyr His Glu Glu Trp Val Thr Ala Ala Val Glu Arg Thr
370 375 380
Ile Pro Val Pro Val Asp Gly Met Glu Tyr His Trp Gly Asn Asn Asp
385 390 395 400
Pro Val Arg Leu Trp Ser Gln Leu Thr Thr Glu Gly Lys Pro His Gly
405 410 415
Trp Pro His Gln Ile Val Gln Tyr Tyr Tyr Gly Leu Tyr Pro Ala Ala
420 425 430
Thr Val Ser Ala Val Val Gly Met Ser Leu Leu Ala Leu Ile Ser Ile
435 440 445
Phe Ala Ser Cys Tyr Met Leu Val Ala Ala Arg Ser Lys Cys Leu Thr
450 455 460
Pro Tyr Ala Leu Thr Pro Gly Ala Ala Val Pro Trp Thr Leu Gly Ile
465 470 475 480
Leu Cys Cys Ala Pro Arg Ala His Ala Ala Ser Val Ala Glu Thr Met
485 490 495
Ala Tyr Leu Trp Asp Gln Asn Gln Ala Leu Phe Trp Leu Glu Phe Ala
500 505 510
Ala Pro Val Ala Cys Ile Leu Ile Ile Thr Tyr Cys Leu Arg Asn Val
515 520 525
Leu Cys Cys Cys Lys Ser Leu Ser Phe Leu Val Leu Leu Ser Leu Gly
530 535 540
Ala Thr Ala Arg Ala Tyr Glu His Ser Thr Val Met Pro Asn Val Val
545 550 555 560
Gly Phe Pro Tyr Lys Ala His Ile Glu Arg Pro Gly Tyr Ser Pro Leu
565 570 575
Thr Leu Gln Met Gln Val Val Glu Thr Ser Leu Glu Pro Thr Leu Asn
580 585 590
Leu Glu Tyr Ile Thr Cys Glu Tyr Lys Thr Val Val Pro Ser Pro Tyr
595 600 605
Val Lys Cys Cys Gly Ala Ser Glu Cys Ser Thr Lys Glu Lys Pro Asp
610 615 620
Tyr Gln Cys Lys Val Tyr Thr Gly Val Tyr Pro Phe Met Trp Gly Gly
625 630 635 640
Ala Tyr Cys Phe Cys Asp Ser Glu Asn Thr Gln Leu Ser Glu Ala Tyr
645 650 655
Val Asp Arg Ser Asp Val Cys Arg His Asp His Ala Ser Ala Tyr Lys
660 665 670
Ala His Thr Ala Ser Leu Lys Ala Lys Val Arg Val Met Tyr Gly Asn
675 680 685
Val Asn Gln Thr Val Asp Val Tyr Val Asn Gly Asp His Ala Val Thr
690 695 700
Ile Gly Gly Thr Gln Phe Ile Phe Gly Pro Leu Ser Ser Ala Trp Thr
705 710 715 720
Pro Phe Asp Asn Lys Ile Val Val Tyr Lys Asp Glu Val Phe Asn Gln
725 730 735
Asp Phe Pro Pro Tyr Gly Ser Gly Gln Pro Gly Arg Phe Gly Asp Ile
740 745 750
Gln Ser Arg Thr Val Glu Ser Asn Asp Leu Tyr Ala Asn Thr Ala Leu
755 760 765
Lys Leu Ala Arg Pro Ser Pro Gly Met Val His Val Pro Tyr Thr Gln
770 775 780
Thr Pro Ser Gly Phe Lys Tyr Trp Leu Lys Glu Lys Gly Thr Ala Leu
785 790 795 800
Asn Thr Lys Ala Pro Phe Gly Cys Gln Ile Lys Thr Asn Pro Val Arg
805 810 815
Ala Met Asn Cys Ala Val Gly Asn Ile Pro Val Ser Met Asn Leu Pro
820 825 830
Asp Ser Ala Phe Thr Arg Ile Val Glu Ala Pro Thr Ile Ile Asp Leu
835 840 845
Thr Cys Thr Val Ala Thr Cys Thr His Ser Ser Asp Phe Gly Gly Val
850 855 860
Leu Thr Leu Thr Tyr Lys Thr Asn Lys Asn Gly Asp Cys Ser Val His
865 870 875 880
Ser His Ser Asn Val Ala Thr Leu Gln Glu Ala Thr Ala Lys Val Lys
885 890 895
Thr Ala Gly Lys Val Thr Leu His Phe Ser Thr Ala Ser Ala Ser Pro
900 905 910
Ser Phe Val Val Ser Leu Cys Ser Ala Arg Ala Thr Cys Ser Ala Ser
915 920 925
Cys Glu Pro Pro Lys Asp His Ile Val Pro Tyr Ala Ala Ser His Ser
930 935 940
Asn Val Val Phe Pro Asp Met Ser Gly Thr Ala Leu Ser Trp Val Gln
945 950 955 960
Lys Ile Ser Gly Gly Leu Gly Ala Phe Ala Ile Gly Ala Ile Leu Val
965 970 975
Leu Val Val Val Thr Cys Ile Gly Leu Arg Arg
980 985
<210> 567
<211> 2949
<212> DNA
<213> Alphavirus Sindbis virus
<400> 567
atgtccgcag caccactggt cacggcaatg tgtttgctcg gaaatgtgag cttcccatgc 60
gaccgcccgc ccacatgcta tacccgcgaa ccttccagag ccctcgacat ccttgaagag 120
aacgtgaacc atgaggccta cgataccctg ctcaatgcca tattgcggtg cggatcgtct 180
ggcagaagca aaagaagcgt cattgacgac tttaccctga ccagccccta cttgggcaca 240
tgctcgtact gccaccatac tgtaccgtgc ttcagccctg ttaagatcga gcaggtctgg 300
gacgaagcgg acgataacac catacgcata cagacttccg cccagtttgg atacgaccaa 360
agcggagcag caagcgcaaa caagtaccgc tacatgtcgc ttaagcagga tcacaccgtt 420
aaagaaggca ccatggatga catcaagatt agcacctcag gaccgtgtag aaggcttagc 480
tacaaaggat actttctcct cgcaaaatgc cctccagggg acagcgtaac ggttagcata 540
gtgagtagca actcagcaac gtcatgtaca ctggcccgca agataaaacc aaaattcgtg 600
ggacgggaaa aatatgatct acctcccgtt cacggtaaaa aaattccttg cacagtgtac 660
gaccgtctga aagaaacaac tgcaggctac atcactatgc acaggccgag accgcacgct 720
tatacatcct acctggaaga atcatcaggg aaagtttacg caaagccgcc atctgggaag 780
aacattacgt atgagtgcaa gtgcggcgac tacaagaccg gaaccgtttc gacccgcacc 840
gaaatcactg gttgcaccgc catcaagcag tgcgtcgcct ataagagcga ccaaacgaag 900
tgggtcttca actcaccgga cttgatcaga catgacgacc acacggccca agggaaattg 960
catttgcctt tcaagttgat cccgagtacc tgcatggtcc ctgttgccca cgcgccgaat 1020
gtaatacatg gctttaaaca catcagcctc caattagata cagaccactt gacattgctc 1080
accaccagga gactaggggc aaacccggaa ccaaccactg aatggatcgt cggaaagacg 1140
gtcagaaact tcaccgtcga ccgagatggc ctggaataca tatggggaaa tcatgagcca 1200
gtgagggtct atgcccaaga gtcagcacca ggagaccctc acggatggcc acacgaaata 1260
gtacagcatt actaccatcg ccatcctgtg tacaccatct tagccgtcgc atcagctacc 1320
gtggcgatga tgattggcgt aactgttgca gtgttatgtg cctgtaaagc gcgccgtgag 1380
tgcctgacgc catacgccct ggccccaaac gccgtaatcc caacttcgct ggcactcttg 1440
tgctgcgtta ggtcggccaa tgctgaaacg ttcaccgaga ccatgagtta cttgtggtcg 1500
aacagtcagc cgttcttctg ggtccagttg tgcatacctt tggccgcttt catcgttcta 1560
atgcgctgct gctcctgctg cctgcctttt ttagtggttg ccggcgccta cctggcgaag 1620
gtagacgcct acgaacatgc gaccactgtt ccaaatgtgc cacagatacc gtataaggca 1680
cttgttgaaa gggcagggta tgccccgctc aatttggaga tcactgtcat gtcctcggag 1740
gttttgcctt ccaccaacca agagtacatt acctgcaaat tcaccactgt ggtcccctcc 1800
ccaaaaatca aatgctgcgg ctccttggaa tgtcagccgg ccgctcatgc agactatacc 1860
tgcaaggtct tcggaggggt ctaccccttt atgtggggag gagcgcaatg tttttgcgac 1920
agtgagaaca gccagatgag tgaggcgtac gtcgaattgt cagcagattg cgcgtctgac 1980
cacgcgcagg cgattaaggt gcacactgcc gcgatgaaag taggactgcg tattgtgtac 2040
gggaacacta ccagtttcct agatgtgtac gtgaacggag tcacaccagg aacgtctaaa 2100
gacttgaaag tcatagctgg accaatttca gcatcgttta cgccattcga tcataaggtc 2160
gttatccatc gcggcctggt gtacaactat gacttcccgg aatatggagc gatgaaacca 2220
ggagcgtttg gagacattca agctacctcc ttgactagca aggatctcat cgccagcaca 2280
gacattaggc tactcaagcc ttccgccaag aacgtgcatg tcccgtacac gcaggcctca 2340
tcaggatttg agatgtggaa aaacaactca ggccgcccac tgcaggaaac cgcacctttc 2400
gggtgtaaga ttgcagtaaa tccgctccga gcggtggact gttcatacgg gaacattccc 2460
atttctattg acatcccgaa cgctgccttt atcaggacat cagatgcacc actggtctca 2520
acagtcaaat gtgaagtcag tgagtgcact tattcagcag acttcggcgg gatggccacc 2580
ctgcagtatg tatccgaccg cgaaggtcaa tgccccgtac attcgcattc gagcacagca 2640
actctccaag agtcgacagt acatgtcctg gagaaaggag cggtgacagt acactttagc 2700
accgcgagtc cacaggcgaa ctttatcgta tcgctgtgtg ggaagaagac aacatgcaat 2760
gcagaatgta aaccaccagc tgaccatatc gtgagcaccc cgcacaaaaa tgaccaagaa 2820
tttcaagccg ccatctcaaa aacatcatgg agttggctgt ttgccctttt cggcggcgcc 2880
tcgtcgctat taattatagg acttatgatt tttgcttgca gcatgatgct gactagcaca 2940
cgaagatga 2949
<210> 568
<211> 982
<212> PRT
<213> Alphavirus Sindbis virus
<400> 568
Met Ser Ala Ala Pro Leu Val Thr Ala Met Cys Leu Leu Gly Asn Val
1 5 10 15
Ser Phe Pro Cys Asp Arg Pro Pro Thr Cys Tyr Thr Arg Glu Pro Ser
20 25 30
Arg Ala Leu Asp Ile Leu Glu Glu Asn Val Asn His Glu Ala Tyr Asp
35 40 45
Thr Leu Leu Asn Ala Ile Leu Arg Cys Gly Ser Ser Gly Arg Ser Lys
50 55 60
Arg Ser Val Ile Asp Asp Phe Thr Leu Thr Ser Pro Tyr Leu Gly Thr
65 70 75 80
Cys Ser Tyr Cys His His Thr Val Pro Cys Phe Ser Pro Val Lys Ile
85 90 95
Glu Gln Val Trp Asp Glu Ala Asp Asp Asn Thr Ile Arg Ile Gln Thr
100 105 110
Ser Ala Gln Phe Gly Tyr Asp Gln Ser Gly Ala Ala Ser Ala Asn Lys
115 120 125
Tyr Arg Tyr Met Ser Leu Lys Gln Asp His Thr Val Lys Glu Gly Thr
130 135 140
Met Asp Asp Ile Lys Ile Ser Thr Ser Gly Pro Cys Arg Arg Leu Ser
145 150 155 160
Tyr Lys Gly Tyr Phe Leu Leu Ala Lys Cys Pro Pro Gly Asp Ser Val
165 170 175
Thr Val Ser Ile Val Ser Ser Asn Ser Ala Thr Ser Cys Thr Leu Ala
180 185 190
Arg Lys Ile Lys Pro Lys Phe Val Gly Arg Glu Lys Tyr Asp Leu Pro
195 200 205
Pro Val His Gly Lys Lys Ile Pro Cys Thr Val Tyr Asp Arg Leu Lys
210 215 220
Glu Thr Thr Ala Gly Tyr Ile Thr Met His Arg Pro Arg Pro His Ala
225 230 235 240
Tyr Thr Ser Tyr Leu Glu Glu Ser Ser Gly Lys Val Tyr Ala Lys Pro
245 250 255
Pro Ser Gly Lys Asn Ile Thr Tyr Glu Cys Lys Cys Gly Asp Tyr Lys
260 265 270
Thr Gly Thr Val Ser Thr Arg Thr Glu Ile Thr Gly Cys Thr Ala Ile
275 280 285
Lys Gln Cys Val Ala Tyr Lys Ser Asp Gln Thr Lys Trp Val Phe Asn
290 295 300
Ser Pro Asp Leu Ile Arg His Asp Asp His Thr Ala Gln Gly Lys Leu
305 310 315 320
His Leu Pro Phe Lys Leu Ile Pro Ser Thr Cys Met Val Pro Val Ala
325 330 335
His Ala Pro Asn Val Ile His Gly Phe Lys His Ile Ser Leu Gln Leu
340 345 350
Asp Thr Asp His Leu Thr Leu Leu Thr Thr Arg Arg Leu Gly Ala Asn
355 360 365
Pro Glu Pro Thr Thr Glu Trp Ile Val Gly Lys Thr Val Arg Asn Phe
370 375 380
Thr Val Asp Arg Asp Gly Leu Glu Tyr Ile Trp Gly Asn His Glu Pro
385 390 395 400
Val Arg Val Tyr Ala Gln Glu Ser Ala Pro Gly Asp Pro His Gly Trp
405 410 415
Pro His Glu Ile Val Gln His Tyr Tyr His Arg His Pro Val Tyr Thr
420 425 430
Ile Leu Ala Val Ala Ser Ala Thr Val Ala Met Met Ile Gly Val Thr
435 440 445
Val Ala Val Leu Cys Ala Cys Lys Ala Arg Arg Glu Cys Leu Thr Pro
450 455 460
Tyr Ala Leu Ala Pro Asn Ala Val Ile Pro Thr Ser Leu Ala Leu Leu
465 470 475 480
Cys Cys Val Arg Ser Ala Asn Ala Glu Thr Phe Thr Glu Thr Met Ser
485 490 495
Tyr Leu Trp Ser Asn Ser Gln Pro Phe Phe Trp Val Gln Leu Cys Ile
500 505 510
Pro Leu Ala Ala Phe Ile Val Leu Met Arg Cys Cys Ser Cys Cys Leu
515 520 525
Pro Phe Leu Val Val Ala Gly Ala Tyr Leu Ala Lys Val Asp Ala Tyr
530 535 540
Glu His Ala Thr Thr Val Pro Asn Val Pro Gln Ile Pro Tyr Lys Ala
545 550 555 560
Leu Val Glu Arg Ala Gly Tyr Ala Pro Leu Asn Leu Glu Ile Thr Val
565 570 575
Met Ser Ser Glu Val Leu Pro Ser Thr Asn Gln Glu Tyr Ile Thr Cys
580 585 590
Lys Phe Thr Thr Val Val Pro Ser Pro Lys Ile Lys Cys Cys Gly Ser
595 600 605
Leu Glu Cys Gln Pro Ala Ala His Ala Asp Tyr Thr Cys Lys Val Phe
610 615 620
Gly Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Gln Cys Phe Cys Asp
625 630 635 640
Ser Glu Asn Ser Gln Met Ser Glu Ala Tyr Val Glu Leu Ser Ala Asp
645 650 655
Cys Ala Ser Asp His Ala Gln Ala Ile Lys Val His Thr Ala Ala Met
660 665 670
Lys Val Gly Leu Arg Ile Val Tyr Gly Asn Thr Thr Ser Phe Leu Asp
675 680 685
Val Tyr Val Asn Gly Val Thr Pro Gly Thr Ser Lys Asp Leu Lys Val
690 695 700
Ile Ala Gly Pro Ile Ser Ala Ser Phe Thr Pro Phe Asp His Lys Val
705 710 715 720
Val Ile His Arg Gly Leu Val Tyr Asn Tyr Asp Phe Pro Glu Tyr Gly
725 730 735
Ala Met Lys Pro Gly Ala Phe Gly Asp Ile Gln Ala Thr Ser Leu Thr
740 745 750
Ser Lys Asp Leu Ile Ala Ser Thr Asp Ile Arg Leu Leu Lys Pro Ser
755 760 765
Ala Lys Asn Val His Val Pro Tyr Thr Gln Ala Ser Ser Gly Phe Glu
770 775 780
Met Trp Lys Asn Asn Ser Gly Arg Pro Leu Gln Glu Thr Ala Pro Phe
785 790 795 800
Gly Cys Lys Ile Ala Val Asn Pro Leu Arg Ala Val Asp Cys Ser Tyr
805 810 815
Gly Asn Ile Pro Ile Ser Ile Asp Ile Pro Asn Ala Ala Phe Ile Arg
820 825 830
Thr Ser Asp Ala Pro Leu Val Ser Thr Val Lys Cys Glu Val Ser Glu
835 840 845
Cys Thr Tyr Ser Ala Asp Phe Gly Gly Met Ala Thr Leu Gln Tyr Val
850 855 860
Ser Asp Arg Glu Gly Gln Cys Pro Val His Ser His Ser Ser Thr Ala
865 870 875 880
Thr Leu Gln Glu Ser Thr Val His Val Leu Glu Lys Gly Ala Val Thr
885 890 895
Val His Phe Ser Thr Ala Ser Pro Gln Ala Asn Phe Ile Val Ser Leu
900 905 910
Cys Gly Lys Lys Thr Thr Cys Asn Ala Glu Cys Lys Pro Pro Ala Asp
915 920 925
His Ile Val Ser Thr Pro His Lys Asn Asp Gln Glu Phe Gln Ala Ala
930 935 940
Ile Ser Lys Thr Ser Trp Ser Trp Leu Phe Ala Leu Phe Gly Gly Ala
945 950 955 960
Ser Ser Leu Leu Ile Ile Gly Leu Met Ile Phe Ala Cys Ser Met Met
965 970 975
Leu Thr Ser Thr Arg Arg
980
<210> 569
<211> 2946
<212> DNA
<213> Alphavirus Chikungunya virus
<400> 569
atgtgcctgt tggcaaacac cacgttcccc tgctcccagc ccccttgcac gccctgctgc 60
tacgaaaagg aaccggagga aaccctacgc atgcttgagg acaacgtcat gagacctggg 120
tactatcagc tgctacaagc atccttaaca tgttctcccc accgccagcg acgcagcacc 180
aaggacaact tcaatgtcta taaagccaca agaccatact tagctcactg tcccgactgt 240
ggagaagggc actcgtgcca tagtcccgta gcactagaac gcatcagaaa tgaagcgaca 300
gacgggacgc tgaaaatcca ggtctccttg caaatcggaa taaagacgga tgacagccac 360
gattggacca agctgcgtta tatggacaac cacatgccag cagacgcaga gagggcgggg 420
ctatttgtaa gaacatcagc accgtgtacg attactggga caatgggaca cttcatcctg 480
gcccgatgtc caaaagggga aactctgacg gtgggattca ctgacagtag gaagattagt 540
cactcatgta cgcacccatt tcaccacgac cctcctgtga taggtcggga aaaattccat 600
tcccgaccgc agcacggtaa agagctacct tgcagcacgt acgtgcagag caccgccgca 660
actaccgagg agatagaggt acacatgccc ccagacaccc ctgatcgcac attaatgtca 720
caacagtccg gcaacgtaaa gatcacagtc aatggccaga cggtgcggta caagtgtaat 780
tgcggtggct caaatgaagg actaacaact acagacaaag tgattaataa ctgcaaggtt 840
gatcaatgtc atgccgcggt caccaatcac aaaaagtggc agtataactc ccctctggtc 900
ccgcgtaatg ctgaacttgg ggaccgaaaa ggaaaaattc acatcccgtt tccgctggca 960
aatgtaacat gcagggtgcc taaagcaagg aaccccaccg tgacgtacgg gaaaaaccaa 1020
gtcatcatgc tactgtatcc tgaccaccca acactcctgt cctaccggaa tatgggagaa 1080
gaaccaaact atcaagaaga gtgggtgatg cataagaagg aagtcgtgct aaccgtgccg 1140
actgaagggc tcgaggtcac gtggggcaac aacgagccgt ataagtattg gccgcagtta 1200
tctacaaacg gtacagccca tggccacccg catgagataa ttctgtatta ttatgagctg 1260
taccccacta tgactgtagt agttgtgtca gtggccacgt tcatactcct gtcgatggtg 1320
ggtatggcag cggggatgtg catgtgtgca cgacgcagat gcatcacacc gtatgaactg 1380
acaccaggag ctaccgtccc tttcctgctt agcctaatat gctgcatcag aacagctaaa 1440
gcggccacat accaagaggc tgcgatatac ctgtggaacg agcagcaacc tttgttttgg 1500
ctacaagccc ttattccgct ggcagccctg attgttctat gcaactgtct gagactctta 1560
ccatgctgct gtaaaacgtt ggctttttta gccgtaatga gcgtcggtgc ccacactgtg 1620
agcgcgtacg aacacgtaac agtgatcccg aacacggtgg gagtaccgta taagactcta 1680
gtcaatagac ctggctacag ccccatggta ttggagatgg aactactgtc agtcactttg 1740
gagccaacac tatcgcttga ttacatcacg tgcgagtaca aaaccgtcat cccgtctccg 1800
tacgtgaagt gctgcggtac agcagagtgc aaggacaaaa acctacctga ctacagctgt 1860
aaggtcttca ccggcgtcta cccatttatg tggggcggcg cctactgctt ctgcgacgct 1920
gaaaacacgc agttgagcga agcacacgtg gagaagtccg aatcatgcaa aacagaattt 1980
gcatcagcat acagggctca taccgcatct gcatcagcta agctccgcgt cctttaccaa 2040
ggaaataaca tcactgtaac tgcctatgca aacggcgacc atgccgtcac agttaaggac 2100
gccaaattca ttgtggggcc aatgtcttca gcctggacac ctttcgacaa caaaattgtg 2160
gtgtacaaag gtgacgtcta taacatggac tacccgccct ttggcgcagg aagaccagga 2220
caatttggcg atatccaaag tcgcacacct gagagtaaag acgtctatgc taatacacaa 2280
ctggtactgc agagaccggc tgtgggtacg gtacacgtgc catactctca ggcaccatct 2340
ggctttaagt attggctaaa agaacgcggg gcgtcgctgc agcacacagc accatttggc 2400
tgccaaatag caacaaaccc ggtaagagcg gtgaactgcg ccgtagggaa catgcccatc 2460
tccatcgaca taccggaagc ggccttcact agggtcgtcg acgcgccctc tttaacggac 2520
atgtcgtgcg aggtaccagc ctgcacccat tcctcagact ttgggggcgt cgccattatt 2580
aaatatgcag ccagcaagaa aggcaagtgt gcggtgcatt cgatgactaa cgccgtcact 2640
attcgggaag ctgagataga agttgaaggg aattctcagc tgcaaatctc tttctcgacg 2700
gccttagcca gcgccgaatt ccgcgtacaa gtctgttcta cacaagtaca ctgtgcagcc 2760
gagtgccacc ccccgaagga ccacatagtc aactacccgg cgtcacatac caccctcggg 2820
gtccaggaca tctccgctac ggcgatgtca tgggtgcaga agatcacggg aggtgtggga 2880
ctggttgttg ctgttgccgc actgattcta atcgtggtgc tatgcgtgtc gttcagcagg 2940
cactaa 2946
<210> 570
<211> 981
<212> PRT
<213> Alphavirus Chikungunya virus
<400> 570
Met Cys Leu Leu Ala Asn Thr Thr Phe Pro Cys Ser Gln Pro Pro Cys
1 5 10 15
Thr Pro Cys Cys Tyr Glu Lys Glu Pro Glu Glu Thr Leu Arg Met Leu
20 25 30
Glu Asp Asn Val Met Arg Pro Gly Tyr Tyr Gln Leu Leu Gln Ala Ser
35 40 45
Leu Thr Cys Ser Pro His Arg Gln Arg Arg Ser Thr Lys Asp Asn Phe
50 55 60
Asn Val Tyr Lys Ala Thr Arg Pro Tyr Leu Ala His Cys Pro Asp Cys
65 70 75 80
Gly Glu Gly His Ser Cys His Ser Pro Val Ala Leu Glu Arg Ile Arg
85 90 95
Asn Glu Ala Thr Asp Gly Thr Leu Lys Ile Gln Val Ser Leu Gln Ile
100 105 110
Gly Ile Lys Thr Asp Asp Ser His Asp Trp Thr Lys Leu Arg Tyr Met
115 120 125
Asp Asn His Met Pro Ala Asp Ala Glu Arg Ala Gly Leu Phe Val Arg
130 135 140
Thr Ser Ala Pro Cys Thr Ile Thr Gly Thr Met Gly His Phe Ile Leu
145 150 155 160
Ala Arg Cys Pro Lys Gly Glu Thr Leu Thr Val Gly Phe Thr Asp Ser
165 170 175
Arg Lys Ile Ser His Ser Cys Thr His Pro Phe His His Asp Pro Pro
180 185 190
Val Ile Gly Arg Glu Lys Phe His Ser Arg Pro Gln His Gly Lys Glu
195 200 205
Leu Pro Cys Ser Thr Tyr Val Gln Ser Thr Ala Ala Thr Thr Glu Glu
210 215 220
Ile Glu Val His Met Pro Pro Asp Thr Pro Asp Arg Thr Leu Met Ser
225 230 235 240
Gln Gln Ser Gly Asn Val Lys Ile Thr Val Asn Gly Gln Thr Val Arg
245 250 255
Tyr Lys Cys Asn Cys Gly Gly Ser Asn Glu Gly Leu Thr Thr Thr Asp
260 265 270
Lys Val Ile Asn Asn Cys Lys Val Asp Gln Cys His Ala Ala Val Thr
275 280 285
Asn His Lys Lys Trp Gln Tyr Asn Ser Pro Leu Val Pro Arg Asn Ala
290 295 300
Glu Leu Gly Asp Arg Lys Gly Lys Ile His Ile Pro Phe Pro Leu Ala
305 310 315 320
Asn Val Thr Cys Arg Val Pro Lys Ala Arg Asn Pro Thr Val Thr Tyr
325 330 335
Gly Lys Asn Gln Val Ile Met Leu Leu Tyr Pro Asp His Pro Thr Leu
340 345 350
Leu Ser Tyr Arg Asn Met Gly Glu Glu Pro Asn Tyr Gln Glu Glu Trp
355 360 365
Val Met His Lys Lys Glu Val Val Leu Thr Val Pro Thr Glu Gly Leu
370 375 380
Glu Val Thr Trp Gly Asn Asn Glu Pro Tyr Lys Tyr Trp Pro Gln Leu
385 390 395 400
Ser Thr Asn Gly Thr Ala His Gly His Pro His Glu Ile Ile Leu Tyr
405 410 415
Tyr Tyr Glu Leu Tyr Pro Thr Met Thr Val Val Val Val Ser Val Ala
420 425 430
Thr Phe Ile Leu Leu Ser Met Val Gly Met Ala Ala Gly Met Cys Met
435 440 445
Cys Ala Arg Arg Arg Cys Ile Thr Pro Tyr Glu Leu Thr Pro Gly Ala
450 455 460
Thr Val Pro Phe Leu Leu Ser Leu Ile Cys Cys Ile Arg Thr Ala Lys
465 470 475 480
Ala Ala Thr Tyr Gln Glu Ala Ala Ile Tyr Leu Trp Asn Glu Gln Gln
485 490 495
Pro Leu Phe Trp Leu Gln Ala Leu Ile Pro Leu Ala Ala Leu Ile Val
500 505 510
Leu Cys Asn Cys Leu Arg Leu Leu Pro Cys Cys Cys Lys Thr Leu Ala
515 520 525
Phe Leu Ala Val Met Ser Val Gly Ala His Thr Val Ser Ala Tyr Glu
530 535 540
His Val Thr Val Ile Pro Asn Thr Val Gly Val Pro Tyr Lys Thr Leu
545 550 555 560
Val Asn Arg Pro Gly Tyr Ser Pro Met Val Leu Glu Met Glu Leu Leu
565 570 575
Ser Val Thr Leu Glu Pro Thr Leu Ser Leu Asp Tyr Ile Thr Cys Glu
580 585 590
Tyr Lys Thr Val Ile Pro Ser Pro Tyr Val Lys Cys Cys Gly Thr Ala
595 600 605
Glu Cys Lys Asp Lys Asn Leu Pro Asp Tyr Ser Cys Lys Val Phe Thr
610 615 620
Gly Val Tyr Pro Phe Met Trp Gly Gly Ala Tyr Cys Phe Cys Asp Ala
625 630 635 640
Glu Asn Thr Gln Leu Ser Glu Ala His Val Glu Lys Ser Glu Ser Cys
645 650 655
Lys Thr Glu Phe Ala Ser Ala Tyr Arg Ala His Thr Ala Ser Ala Ser
660 665 670
Ala Lys Leu Arg Val Leu Tyr Gln Gly Asn Asn Ile Thr Val Thr Ala
675 680 685
Tyr Ala Asn Gly Asp His Ala Val Thr Val Lys Asp Ala Lys Phe Ile
690 695 700
Val Gly Pro Met Ser Ser Ala Trp Thr Pro Phe Asp Asn Lys Ile Val
705 710 715 720
Val Tyr Lys Gly Asp Val Tyr Asn Met Asp Tyr Pro Pro Phe Gly Ala
725 730 735
Gly Arg Pro Gly Gln Phe Gly Asp Ile Gln Ser Arg Thr Pro Glu Ser
740 745 750
Lys Asp Val Tyr Ala Asn Thr Gln Leu Val Leu Gln Arg Pro Ala Val
755 760 765
Gly Thr Val His Val Pro Tyr Ser Gln Ala Pro Ser Gly Phe Lys Tyr
770 775 780
Trp Leu Lys Glu Arg Gly Ala Ser Leu Gln His Thr Ala Pro Phe Gly
785 790 795 800
Cys Gln Ile Ala Thr Asn Pro Val Arg Ala Val Asn Cys Ala Val Gly
805 810 815
Asn Met Pro Ile Ser Ile Asp Ile Pro Glu Ala Ala Phe Thr Arg Val
820 825 830
Val Asp Ala Pro Ser Leu Thr Asp Met Ser Cys Glu Val Pro Ala Cys
835 840 845
Thr His Ser Ser Asp Phe Gly Gly Val Ala Ile Ile Lys Tyr Ala Ala
850 855 860
Ser Lys Lys Gly Lys Cys Ala Val His Ser Met Thr Asn Ala Val Thr
865 870 875 880
Ile Arg Glu Ala Glu Ile Glu Val Glu Gly Asn Ser Gln Leu Gln Ile
885 890 895
Ser Phe Ser Thr Ala Leu Ala Ser Ala Glu Phe Arg Val Gln Val Cys
900 905 910
Ser Thr Gln Val His Cys Ala Ala Glu Cys His Pro Pro Lys Asp His
915 920 925
Ile Val Asn Tyr Pro Ala Ser His Thr Thr Leu Gly Val Gln Asp Ile
930 935 940
Ser Ala Thr Ala Met Ser Trp Val Gln Lys Ile Thr Gly Gly Val Gly
945 950 955 960
Leu Val Val Ala Val Ala Ala Leu Ile Leu Ile Val Val Leu Cys Val
965 970 975
Ser Phe Ser Arg His
980
<210> 571
<211> 1509
<212> DNA
<213> Bornavirus Borna disease virus 1
<400> 571
atgcagctga gcatgagcag cctgatcggc ttcggcaccc tggtgctggc cctgagcgcc 60
cagaccttcg acctgcaggg cctgagctgc aacaccgaca gcacccccgg cctgatcgac 120
ctggagatca ggaggctgtg ccacaccccc accgagaacg tgatcagctg cgaggtgagc 180
tacctgaacc acaccaccat cagcctgccc gccgtgcaca ccagctgcct gaagtaccac 240
tgcaagacct actggggctt cttcggcagc tacagcgccg acaggatcat caacaggtac 300
accggcaccg tgaagggctg cctgaacaac agcgcccccg aggacccctt cgagtgcaac 360
tggttctact gctgcagcgc catcaccacc gagatctgca ggtgcagcat caccaacgtg 420
accgtggccg tgcagacctt cccccccttc atgtactgca gcttcgccga ctgcagcacc 480
gtgagccagc aggagctgga gagcggcaag gccatgctga gcgacggcag caccctgacc 540
tacaccccct acatcctgca gagcgaggtg gtgaacaaga ccctgaacgg caccatcctg 600
tgcaacagca gcagcaagat cgtgagcttc gacgagttca ggaggagcta cagcctggcc 660
aacggcagct accagagcag cagcatcaac gtgacctgcg tgaactacac cagcagctgc 720
aggagcaagc tgaggaggag gaggagggac acccagcaga tcgagtacct ggtgcacaag 780
ctgaggccca ccctgaagga cgcctgggag gactgcgaga tcctgcagag cctgctgctg 840
ggcgtgttcg gcaccggcat cgccagcgcc agccagttcc tgaggggctg gctgaaccac 900
cccgacatca tcggctacat cgtgaacggc gtgggcgtgg tgtggcagtg ccacagggtg 960
aacgtgacct tcatggcctg gaacgagagc acctactacc cccccgtgga ctacaacggc 1020
aggaagtact tcctgaacga cgagggcagg ctgcagacca acacccccga ggccaggccc 1080
ggcctgaaga gggtgatgtg gttcggcagg tacttcctgg gcaccgtggg cagcggcgtg 1140
aagcccagga ggatcaggta caacaagacc agccacgact accacctgga ggagttcgag 1200
gccagcctga acatgacccc ccagaccagc atcgccagcg gccacgagac cgaccccatc 1260
aaccacgcct acggcaccca ggccgacctg ctgccctaca ccaggagcag caacatcacc 1320
agcaccgaca ccggcagcgg ctgggtgcac atcggcctgc ccagcttcgc cttcctgaac 1380
cccctgggct ggctgaggga cctgctggcc tgggccgcct ggctgggcgg cgtgctgtac 1440
ctgatcagcc tgtgcgtgag cctgcccgcc agcttcgcca ggaggaggag gctgggcagg 1500
tggcaggag 1509
<210> 572
<211> 503
<212> PRT
<213> Bornavirus Borna disease virus 1
<400> 572
Met Gln Leu Ser Met Ser Ser Leu Ile Gly Phe Gly Thr Leu Val Leu
1 5 10 15
Ala Leu Ser Ala Gln Thr Phe Asp Leu Gln Gly Leu Ser Cys Asn Thr
20 25 30
Asp Ser Thr Pro Gly Leu Ile Asp Leu Glu Ile Arg Arg Leu Cys His
35 40 45
Thr Pro Thr Glu Asn Val Ile Ser Cys Glu Val Ser Tyr Leu Asn His
50 55 60
Thr Thr Ile Ser Leu Pro Ala Val His Thr Ser Cys Leu Lys Tyr His
65 70 75 80
Cys Lys Thr Tyr Trp Gly Phe Phe Gly Ser Tyr Ser Ala Asp Arg Ile
85 90 95
Ile Asn Arg Tyr Thr Gly Thr Val Lys Gly Cys Leu Asn Asn Ser Ala
100 105 110
Pro Glu Asp Pro Phe Glu Cys Asn Trp Phe Tyr Cys Cys Ser Ala Ile
115 120 125
Thr Thr Glu Ile Cys Arg Cys Ser Ile Thr Asn Val Thr Val Ala Val
130 135 140
Gln Thr Phe Pro Pro Phe Met Tyr Cys Ser Phe Ala Asp Cys Ser Thr
145 150 155 160
Val Ser Gln Gln Glu Leu Glu Ser Gly Lys Ala Met Leu Ser Asp Gly
165 170 175
Ser Thr Leu Thr Tyr Thr Pro Tyr Ile Leu Gln Ser Glu Val Val Asn
180 185 190
Lys Thr Leu Asn Gly Thr Ile Leu Cys Asn Ser Ser Ser Lys Ile Val
195 200 205
Ser Phe Asp Glu Phe Arg Arg Ser Tyr Ser Leu Ala Asn Gly Ser Tyr
210 215 220
Gln Ser Ser Ser Ile Asn Val Thr Cys Val Asn Tyr Thr Ser Ser Cys
225 230 235 240
Arg Ser Lys Leu Arg Arg Arg Arg Arg Asp Thr Gln Gln Ile Glu Tyr
245 250 255
Leu Val His Lys Leu Arg Pro Thr Leu Lys Asp Ala Trp Glu Asp Cys
260 265 270
Glu Ile Leu Gln Ser Leu Leu Leu Gly Val Phe Gly Thr Gly Ile Ala
275 280 285
Ser Ala Ser Gln Phe Leu Arg Gly Trp Leu Asn His Pro Asp Ile Ile
290 295 300
Gly Tyr Ile Val Asn Gly Val Gly Val Val Trp Gln Cys His Arg Val
305 310 315 320
Asn Val Thr Phe Met Ala Trp Asn Glu Ser Thr Tyr Tyr Pro Pro Val
325 330 335
Asp Tyr Asn Gly Arg Lys Tyr Phe Leu Asn Asp Glu Gly Arg Leu Gln
340 345 350
Thr Asn Thr Pro Glu Ala Arg Pro Gly Leu Lys Arg Val Met Trp Phe
355 360 365
Gly Arg Tyr Phe Leu Gly Thr Val Gly Ser Gly Val Lys Pro Arg Arg
370 375 380
Ile Arg Tyr Asn Lys Thr Ser His Asp Tyr His Leu Glu Glu Phe Glu
385 390 395 400
Ala Ser Leu Asn Met Thr Pro Gln Thr Ser Ile Ala Ser Gly His Glu
405 410 415
Thr Asp Pro Ile Asn His Ala Tyr Gly Thr Gln Ala Asp Leu Leu Pro
420 425 430
Tyr Thr Arg Ser Ser Asn Ile Thr Ser Thr Asp Thr Gly Ser Gly Trp
435 440 445
Val His Ile Gly Leu Pro Ser Phe Ala Phe Leu Asn Pro Leu Gly Trp
450 455 460
Leu Arg Asp Leu Leu Ala Trp Ala Ala Trp Leu Gly Gly Val Leu Tyr
465 470 475 480
Leu Ile Ser Leu Cys Val Ser Leu Pro Ala Ser Phe Ala Arg Arg Arg
485 490 495
Arg Leu Gly Arg Trp Gln Glu
500
<210> 573
<211> 1488
<212> DNA
<213> Flavivirus Tick-borne encephalitis virus
<400> 573
agcaggtgca cccacctgga gaacagggac ttcgtgaccg gcacccaggg caccaccagg 60
gtgaccctgg tgctggagct gggcggctgc gtgaccatca ccgccgaggg caagcccagc 120
atggacgtgt ggctggacgc catctaccag gagaaccccg cccagaccag ggagtactgc 180
ctgcacgcca agctgagcga caccaaggtg gccgccaggt gccccaccat gggccccgcc 240
accctggccg aggagcacca gggcggcacc gtgtgcaaga gggaccagag cgacaggggc 300
tggggcaacc actgcggcct gttcggcaag ggcagcatcg tggcctgcgt gaaggccgcc 360
tgcgaggcca agaagaaggc caccggccac gtgtacgacg ccaacaagat cgtgtacacc 420
gtgaaggtgg agccccacac cggcgactac gtggccgcca acgagaccca cagcggcagg 480
aagaccgcca gcttcaccgt gagcagcgag aagaccatcc tgaccatggg cgagtacggc 540
gacgtgagcc tgctgtgcag ggtggccagc ggcgtggacc tggcccagac cgtgatcctg 600
gagctggaca agaccgtgga gcacctgccc accgcctggc aggtgcacag ggactggttc 660
aacgacctgg ccctgccctg gaagcacgag ggcgccagga actggaacaa cgccgagagg 720
ctggtggagt tcggcgcccc ccacgccgtg aagatggacg tgtacaacct gggcgaccag 780
accggcgtgc tgctgaaggc cctggccggc gtgcccgtgg cccacatcga gggcaccaag 840
taccacctga agagcggcca cgtgacctgc gaggtgggcc tggagaagct gaagatgaag 900
ggcctgacct acaccatgtg cgacaagacc aagttcacct ggaagagggc ccccaccgac 960
agcggccacg acaccgtggt gatggaggtg accttcagcg gcaccaagcc ctgcaggatc 1020
cccgtgaggg ccgtggccca cggcagcccc gacgtgaacg tggccatgct gatcaccccc 1080
aaccccacca tcgagaacaa cggcggcggc ttcatcgaga tgcagctgcc ccccggcgac 1140
aacatcatct acgtgggcga gctgagctac cagtggttcc agaagggcag cagcatcggc 1200
agggtgttcc agaagaccaa gaagggcatc gagaggctga ccgtgatcgg cgagcacgcc 1260
tgggacttcg gcagcgccgg cggcttcctg agcagcatcg gcaaggccct gcacaccgtg 1320
ctgggcggcg ccttcaacag catcttcggc ggcgtgggct tcctgcccaa gctgctgctg 1380
ggcgtggccc tggcctggct gggcctgaac atgaggaacc ccaccatgag catgagcttc 1440
ctgctggccg gcgtgctggt gctggccatg accctgggcg tgggcgcc 1488
<210> 574
<211> 496
<212> PRT
<213> Flavivirus Tick-borne encephalitis virus
<400> 574
Ser Arg Cys Thr His Leu Glu Asn Arg Asp Phe Val Thr Gly Thr Gln
1 5 10 15
Gly Thr Thr Arg Val Thr Leu Val Leu Glu Leu Gly Gly Cys Val Thr
20 25 30
Ile Thr Ala Glu Gly Lys Pro Ser Met Asp Val Trp Leu Asp Ala Ile
35 40 45
Tyr Gln Glu Asn Pro Ala Gln Thr Arg Glu Tyr Cys Leu His Ala Lys
50 55 60
Leu Ser Asp Thr Lys Val Ala Ala Arg Cys Pro Thr Met Gly Pro Ala
65 70 75 80
Thr Leu Ala Glu Glu His Gln Gly Gly Thr Val Cys Lys Arg Asp Gln
85 90 95
Ser Asp Arg Gly Trp Gly Asn His Cys Gly Leu Phe Gly Lys Gly Ser
100 105 110
Ile Val Ala Cys Val Lys Ala Ala Cys Glu Ala Lys Lys Lys Ala Thr
115 120 125
Gly His Val Tyr Asp Ala Asn Lys Ile Val Tyr Thr Val Lys Val Glu
130 135 140
Pro His Thr Gly Asp Tyr Val Ala Ala Asn Glu Thr His Ser Gly Arg
145 150 155 160
Lys Thr Ala Ser Phe Thr Val Ser Ser Glu Lys Thr Ile Leu Thr Met
165 170 175
Gly Glu Tyr Gly Asp Val Ser Leu Leu Cys Arg Val Ala Ser Gly Val
180 185 190
Asp Leu Ala Gln Thr Val Ile Leu Glu Leu Asp Lys Thr Val Glu His
195 200 205
Leu Pro Thr Ala Trp Gln Val His Arg Asp Trp Phe Asn Asp Leu Ala
210 215 220
Leu Pro Trp Lys His Glu Gly Ala Arg Asn Trp Asn Asn Ala Glu Arg
225 230 235 240
Leu Val Glu Phe Gly Ala Pro His Ala Val Lys Met Asp Val Tyr Asn
245 250 255
Leu Gly Asp Gln Thr Gly Val Leu Leu Lys Ala Leu Ala Gly Val Pro
260 265 270
Val Ala His Ile Glu Gly Thr Lys Tyr His Leu Lys Ser Gly His Val
275 280 285
Thr Cys Glu Val Gly Leu Glu Lys Leu Lys Met Lys Gly Leu Thr Tyr
290 295 300
Thr Met Cys Asp Lys Thr Lys Phe Thr Trp Lys Arg Ala Pro Thr Asp
305 310 315 320
Ser Gly His Asp Thr Val Val Met Glu Val Thr Phe Ser Gly Thr Lys
325 330 335
Pro Cys Arg Ile Pro Val Arg Ala Val Ala His Gly Ser Pro Asp Val
340 345 350
Asn Val Ala Met Leu Ile Thr Pro Asn Pro Thr Ile Glu Asn Asn Gly
355 360 365
Gly Gly Phe Ile Glu Met Gln Leu Pro Pro Gly Asp Asn Ile Ile Tyr
370 375 380
Val Gly Glu Leu Ser Tyr Gln Trp Phe Gln Lys Gly Ser Ser Ile Gly
385 390 395 400
Arg Val Phe Gln Lys Thr Lys Lys Gly Ile Glu Arg Leu Thr Val Ile
405 410 415
Gly Glu His Ala Trp Asp Phe Gly Ser Ala Gly Gly Phe Leu Ser Ser
420 425 430
Ile Gly Lys Ala Leu His Thr Val Leu Gly Gly Ala Phe Asn Ser Ile
435 440 445
Phe Gly Gly Val Gly Phe Leu Pro Lys Leu Leu Leu Gly Val Ala Leu
450 455 460
Ala Trp Leu Gly Leu Asn Met Arg Asn Pro Thr Met Ser Met Ser Phe
465 470 475 480
Leu Leu Ala Gly Val Leu Val Leu Ala Met Thr Leu Gly Val Gly Ala
485 490 495
<210> 575
<211> 1836
<212> DNA
<213> Flavivirus Usutu virus
<400> 575
agcaccgtga gcaactgccc caccaccggc gaggcccaca accccaagag ggccgaggac 60
acctacgtgt gcaagagcgg cgtgaccgac aggggctggg gcaacggctg cggcctgttc 120
ggcaagggca gcatcgacac ctgcgccaac ttcacctgca gcctgaaggc catgggcagg 180
atgatccagc ccgagaacgt gaagtacgag gtgggcatct tcatccacgg cagcaccagc 240
agcgacaccc acggcaacta cagcagccag ctgggcgcca gccaggccgg caggttcacc 300
atcaccccca acagccccgc catcaccgtg aagatgggcg actacggcga gatcagcgtg 360
gagtgcgagc ccaggaacgg cctgaacacc gaggcctact acatcatgag cgtgggcacc 420
aagcacttcc tggtgcacag ggagtggttc aacgacctgg ccctgccctg gaccagcccc 480
gccagcagca actggaggaa cagggagatc ctgctggagt tcgaggagcc ccacgccacc 540
aagcagagcg tggtggccct gggcagccag gagggcgccc tgcaccaggc cctggccggc 600
gccgtgcccg tgagcttcag cggcagcgtg aagctgacca gcggccacct gaagtgcagg 660
gtgaagatgg agaagctgac cctgaagggc accacctacg gcatgtgcac cgagaagttc 720
agcttcgcca agaaccccgc cgacaccggc cacggcaccg tggtgctgga gctgcagtac 780
accggcagcg acggcccctg caagatcccc atcagcatcg tggccagcct gagcgacctg 840
acccccatcg gcaggatggt gaccgccaac ccctacgtgg ccagcagcga ggccaacgcc 900
aaggtgctgg tggagatgga gccccccttc ggcgacagct acatcgtggt gggcaggggc 960
gacaagcaga tcaaccacca ctggcacaag gccggcagca gcatcggcaa ggccttcatc 1020
accaccatca agggcgccca gaggctggcc gccctgggcg acaccgcctg ggacttcggc 1080
agcgtgggcg gcatcttcaa cagcgtgggc aaggccgtgc accaggtgtt cggcggcgcc 1140
ttcaggaccc tgttcggcgg catgagctgg atcacccagg gcctgatggg cgccctgctg 1200
ctgtggatgg gcgtgaacgc cagggacagg agcatcgccc tggtgatgct ggccaccggc 1260
ggcgtgctgc tgttcctggc caccaacgtg cacgccgaca gcggctgcgc catcgacgtg 1320
ggcaggaggg agctgaggtg cggccagggc atcttcatcc acaacgacgt ggaggcctgg 1380
gtggacaggt acaagttcat gcccgagacc cccaagcagc tggccaaggt gatcgagcag 1440
gcccacgcca agggcatctg cggcctgagg agcgtgagca ggctggagca cgtgatgtgg 1500
gagaacatca gggacgagct gaacaccctg ctgagggaga acgccgtgga cctgagcgtg 1560
gtggtggaga agcccaaggg catgtacaag agcgcccccc agaggctggc cctgaccagc 1620
gaggagttcg agatcggctg gaaggcctgg ggcaagagcc tggtgttcgc ccccgagctg 1680
gccaaccaca ccttcgtggt ggacggcccc gagaccaagg agtgccccga cgccaagagg 1740
gcctggaaca gcctggagat cgaggacttc ggcttcggca tcatgagcac cagggtgtgg 1800
ctgaaggtga gggagcacaa caccaccgac tgcgac 1836
<210> 576
<211> 612
<212> PRT
<213> Flavivirus Usutu virus
<400> 576
Ser Thr Val Ser Asn Cys Pro Thr Thr Gly Glu Ala His Asn Pro Lys
1 5 10 15
Arg Ala Glu Asp Thr Tyr Val Cys Lys Ser Gly Val Thr Asp Arg Gly
20 25 30
Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser Ile Asp Thr Cys
35 40 45
Ala Asn Phe Thr Cys Ser Leu Lys Ala Met Gly Arg Met Ile Gln Pro
50 55 60
Glu Asn Val Lys Tyr Glu Val Gly Ile Phe Ile His Gly Ser Thr Ser
65 70 75 80
Ser Asp Thr His Gly Asn Tyr Ser Ser Gln Leu Gly Ala Ser Gln Ala
85 90 95
Gly Arg Phe Thr Ile Thr Pro Asn Ser Pro Ala Ile Thr Val Lys Met
100 105 110
Gly Asp Tyr Gly Glu Ile Ser Val Glu Cys Glu Pro Arg Asn Gly Leu
115 120 125
Asn Thr Glu Ala Tyr Tyr Ile Met Ser Val Gly Thr Lys His Phe Leu
130 135 140
Val His Arg Glu Trp Phe Asn Asp Leu Ala Leu Pro Trp Thr Ser Pro
145 150 155 160
Ala Ser Ser Asn Trp Arg Asn Arg Glu Ile Leu Leu Glu Phe Glu Glu
165 170 175
Pro His Ala Thr Lys Gln Ser Val Val Ala Leu Gly Ser Gln Glu Gly
180 185 190
Ala Leu His Gln Ala Leu Ala Gly Ala Val Pro Val Ser Phe Ser Gly
195 200 205
Ser Val Lys Leu Thr Ser Gly His Leu Lys Cys Arg Val Lys Met Glu
210 215 220
Lys Leu Thr Leu Lys Gly Thr Thr Tyr Gly Met Cys Thr Glu Lys Phe
225 230 235 240
Ser Phe Ala Lys Asn Pro Ala Asp Thr Gly His Gly Thr Val Val Leu
245 250 255
Glu Leu Gln Tyr Thr Gly Ser Asp Gly Pro Cys Lys Ile Pro Ile Ser
260 265 270
Ile Val Ala Ser Leu Ser Asp Leu Thr Pro Ile Gly Arg Met Val Thr
275 280 285
Ala Asn Pro Tyr Val Ala Ser Ser Glu Ala Asn Ala Lys Val Leu Val
290 295 300
Glu Met Glu Pro Pro Phe Gly Asp Ser Tyr Ile Val Val Gly Arg Gly
305 310 315 320
Asp Lys Gln Ile Asn His His Trp His Lys Ala Gly Ser Ser Ile Gly
325 330 335
Lys Ala Phe Ile Thr Thr Ile Lys Gly Ala Gln Arg Leu Ala Ala Leu
340 345 350
Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly Gly Ile Phe Asn Ser
355 360 365
Val Gly Lys Ala Val His Gln Val Phe Gly Gly Ala Phe Arg Thr Leu
370 375 380
Phe Gly Gly Met Ser Trp Ile Thr Gln Gly Leu Met Gly Ala Leu Leu
385 390 395 400
Leu Trp Met Gly Val Asn Ala Arg Asp Arg Ser Ile Ala Leu Val Met
405 410 415
Leu Ala Thr Gly Gly Val Leu Leu Phe Leu Ala Thr Asn Val His Ala
420 425 430
Asp Ser Gly Cys Ala Ile Asp Val Gly Arg Arg Glu Leu Arg Cys Gly
435 440 445
Gln Gly Ile Phe Ile His Asn Asp Val Glu Ala Trp Val Asp Arg Tyr
450 455 460
Lys Phe Met Pro Glu Thr Pro Lys Gln Leu Ala Lys Val Ile Glu Gln
465 470 475 480
Ala His Ala Lys Gly Ile Cys Gly Leu Arg Ser Val Ser Arg Leu Glu
485 490 495
His Val Met Trp Glu Asn Ile Arg Asp Glu Leu Asn Thr Leu Leu Arg
500 505 510
Glu Asn Ala Val Asp Leu Ser Val Val Val Glu Lys Pro Lys Gly Met
515 520 525
Tyr Lys Ser Ala Pro Gln Arg Leu Ala Leu Thr Ser Glu Glu Phe Glu
530 535 540
Ile Gly Trp Lys Ala Trp Gly Lys Ser Leu Val Phe Ala Pro Glu Leu
545 550 555 560
Ala Asn His Thr Phe Val Val Asp Gly Pro Glu Thr Lys Glu Cys Pro
565 570 575
Asp Ala Lys Arg Ala Trp Asn Ser Leu Glu Ile Glu Asp Phe Gly Phe
580 585 590
Gly Ile Met Ser Thr Arg Val Trp Leu Lys Val Arg Glu His Asn Thr
595 600 605
Thr Asp Cys Asp
610
<210> 577
<211> 1503
<212> DNA
<213> Flavivirus St. Louis encephalitis virus
<400> 577
ttcaactgcc tgggcaccag caacagggac ttcgtggagg gcgccagcgg cgccacctgg 60
atcgacctgg tgctggaggg cggcagctgc gtgaccgtga tggcccccga gaagcccacc 120
ctggacttca aggtgatgaa gatggaggcc accgagctgg ccaccgtgag ggagtactgc 180
tacgaggcca ccctggacac cctgagcacc gtggccaggt gccccaccac cggcgaggcc 240
cacaacacca agaggagcga ccccaccttc gtgtgcaaga gggacgtggt ggacaggggc 300
tggggcaacg gctgcggcct gttcggcaag ggcagcatcg acacctgcgc caagttcacc 360
tgcaagagca aggccaccgg caagaccatc ctgagggaga acatcaagta cgaggtggcc 420
atcttcgtgc acggcagcac cgacagcacc acccacggca actacttcga gcagatcggc 480
aagaaccagg ccgccaggtt caccatcagc ccccaggccc ccagcttcac cgccaacatg 540
ggcgagtacg gcaccgtgac catcgactgc gaggccagga gcggcatcaa caccgaggac 600
tactacgtgt tcaccgtgaa ggagaagagc tggctggtga acagggactg gttccacgac 660
ctgaacctgc cctggaccag ccccgccacc accgactgga ggaacaggga gaccctggtg 720
gagttcgagg agccccacgc caccaagcag accgtggtgg ccctgggcag ccaggagggc 780
gccctgcaca ccgccctggc cggcgccatc cccgccaccg tgagcagcag caccctgacc 840
ctgcagagcg gccacctgaa gtgcagggcc aagctggaca aggtgaagat caagggcacc 900
acctacggca tgtgcgacag cgccttcacc ttcagcaaga accccgccga caccggccac 960
ggcaccgtga tcgtggagct gcagtacacc ggcagcaacg gcccctgcag ggtgcccatc 1020
agcgtgaccg ccaacctgat ggacctgacc cccgtgggca ggctggtgac cgtgaacccc 1080
ttcatcagca ccggcggcgc caacaacaag gtgatggtgg aggtggagcc ccccttcggc 1140
gacagctaca tcgtggtggg caggggcacc acccagatca actaccactg gcacaaggag 1200
ggcagcagca tcggcaaggc cctggccacc acctggaagg gcgcccagag gctggccgtg 1260
ctgggcgaca ccgcctggga cttcggcagc atcggcggcg tgttcaacag catcggcaag 1320
gccgtgcacc aggtgttcgg cggcgccttc aggaccctgt tcggcggcat gagctggatc 1380
acccagggcc tgctgggcgc cctgctgctg tggatgggcc tgcaggccag ggacaggagc 1440
atcagcctga ccctgctggc cgtgggcggc atcctgatct tcctggccac cagcgtgcag 1500
gcc 1503
<210> 578
<211> 501
<212> PRT
<213> Flavivirus St. Louis encephalitis virus
<400> 578
Phe Asn Cys Leu Gly Thr Ser Asn Arg Asp Phe Val Glu Gly Ala Ser
1 5 10 15
Gly Ala Thr Trp Ile Asp Leu Val Leu Glu Gly Gly Ser Cys Val Thr
20 25 30
Val Met Ala Pro Glu Lys Pro Thr Leu Asp Phe Lys Val Met Lys Met
35 40 45
Glu Ala Thr Glu Leu Ala Thr Val Arg Glu Tyr Cys Tyr Glu Ala Thr
50 55 60
Leu Asp Thr Leu Ser Thr Val Ala Arg Cys Pro Thr Thr Gly Glu Ala
65 70 75 80
His Asn Thr Lys Arg Ser Asp Pro Thr Phe Val Cys Lys Arg Asp Val
85 90 95
Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser
100 105 110
Ile Asp Thr Cys Ala Lys Phe Thr Cys Lys Ser Lys Ala Thr Gly Lys
115 120 125
Thr Ile Leu Arg Glu Asn Ile Lys Tyr Glu Val Ala Ile Phe Val His
130 135 140
Gly Ser Thr Asp Ser Thr Thr His Gly Asn Tyr Phe Glu Gln Ile Gly
145 150 155 160
Lys Asn Gln Ala Ala Arg Phe Thr Ile Ser Pro Gln Ala Pro Ser Phe
165 170 175
Thr Ala Asn Met Gly Glu Tyr Gly Thr Val Thr Ile Asp Cys Glu Ala
180 185 190
Arg Ser Gly Ile Asn Thr Glu Asp Tyr Tyr Val Phe Thr Val Lys Glu
195 200 205
Lys Ser Trp Leu Val Asn Arg Asp Trp Phe His Asp Leu Asn Leu Pro
210 215 220
Trp Thr Ser Pro Ala Thr Thr Asp Trp Arg Asn Arg Glu Thr Leu Val
225 230 235 240
Glu Phe Glu Glu Pro His Ala Thr Lys Gln Thr Val Val Ala Leu Gly
245 250 255
Ser Gln Glu Gly Ala Leu His Thr Ala Leu Ala Gly Ala Ile Pro Ala
260 265 270
Thr Val Ser Ser Ser Thr Leu Thr Leu Gln Ser Gly His Leu Lys Cys
275 280 285
Arg Ala Lys Leu Asp Lys Val Lys Ile Lys Gly Thr Thr Tyr Gly Met
290 295 300
Cys Asp Ser Ala Phe Thr Phe Ser Lys Asn Pro Ala Asp Thr Gly His
305 310 315 320
Gly Thr Val Ile Val Glu Leu Gln Tyr Thr Gly Ser Asn Gly Pro Cys
325 330 335
Arg Val Pro Ile Ser Val Thr Ala Asn Leu Met Asp Leu Thr Pro Val
340 345 350
Gly Arg Leu Val Thr Val Asn Pro Phe Ile Ser Thr Gly Gly Ala Asn
355 360 365
Asn Lys Val Met Val Glu Val Glu Pro Pro Phe Gly Asp Ser Tyr Ile
370 375 380
Val Val Gly Arg Gly Thr Thr Gln Ile Asn Tyr His Trp His Lys Glu
385 390 395 400
Gly Ser Ser Ile Gly Lys Ala Leu Ala Thr Thr Trp Lys Gly Ala Gln
405 410 415
Arg Leu Ala Val Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Ile Gly
420 425 430
Gly Val Phe Asn Ser Ile Gly Lys Ala Val His Gln Val Phe Gly Gly
435 440 445
Ala Phe Arg Thr Leu Phe Gly Gly Met Ser Trp Ile Thr Gln Gly Leu
450 455 460
Leu Gly Ala Leu Leu Leu Trp Met Gly Leu Gln Ala Arg Asp Arg Ser
465 470 475 480
Ile Ser Leu Thr Leu Leu Ala Val Gly Gly Ile Leu Ile Phe Leu Ala
485 490 495
Thr Ser Val Gln Ala
500
<210> 579
<211> 1416
<212> DNA
<213> Flavivirus Yellow fever virus
<400> 579
gtgggccccg cctacagcgc ccactgcatc ggcatcaccg acagggactt catcgagggc 60
gtgcacggcg gcacctgggt gagcgccacc ctggagcagg acaagtgcgt gaccgtgatg 120
gcccccgaca agcccagcct ggacatcagc ctggagaccg tggccatcga caggcccgcc 180
gaggtgagga aggtgtgcta caacgccgtg ctgacccacg tgaagatcaa cgacaagtgc 240
cccagcaccg gcgaggccca cctggccgag gagaacgagg gcgacaacgc ctgcaagagg 300
acctacagcg acaggggctg gggcaacggc tgcggcctgt tcggcaaggg cagcatcgtg 360
gcctgcgcca agttcacctg cgccaagagc atgagcctgt tcgaggtgga ccagaccaag 420
atccagtacg tgatcagggc ccagctgcac gtgggcgcca agcaggagaa ctggaacacc 480
gacatcaaga ccctgaagtt cgacgccctg agcggcagcc aggaggtgga gttcatcggc 540
tacggcaagg ccaccctgga gtgccaggtg cagaccgccg tggacttcgg caacagctac 600
atcgccgaga tggagaccga gagctggatc gtggacaggc agtgggccca ggacctgacc 660
ctgccctggc agagcggcag cggcggcgtg tggagggaga tgcaccacct ggtggagttc 720
gagccccccc acgccgccac catcagggtg ctggccctgg gcaaccagga gggcagcctg 780
aagaccgccc tgaccggcgc catgagggtg accaaggaca ccaacgacaa caacctgtac 840
aagctgcacg gcggccacgt gagctgcagg gtgaagctga gcgccctgac cctgaagggc 900
accagctaca agatctgcac cgacaagatg ttcttcgtga agaaccccac cgacaccggc 960
cacggcaccg tggtgatgca ggtgaaggtg agcaagggcg ccccctgcag gatccccgtg 1020
atcgtggccg acgacctgac cgccgccatc aacaagggca tcctggtgac cgtgaacccc 1080
atcgccagca ccaacgacga cgaggtgctg atcgaggtga accccccctt cggcgacagc 1140
tacatcatcg tgggcagggg cgacagcagg ctgacctacc agtggcacaa ggagggcagc 1200
agcatcggca agctgttcac ccagaccatg aagggcgtgg agaggctggc cgtgatgggc 1260
gacaccgcct gggacttcag cagcgccggc ggcttcttca ccagcgtggg caagggcatc 1320
cacaccgtgt tcggcagcgc cttccagggc ctgttcggcg gcctgaactg gatcaccaag 1380
gtgatcatgg gcgccgtgct gatctgggtg ggcatc 1416
<210> 580
<211> 472
<212> PRT
<213> Flavivirus Yellow fever virus
<400> 580
Val Gly Pro Ala Tyr Ser Ala His Cys Ile Gly Ile Thr Asp Arg Asp
1 5 10 15
Phe Ile Glu Gly Val His Gly Gly Thr Trp Val Ser Ala Thr Leu Glu
20 25 30
Gln Asp Lys Cys Val Thr Val Met Ala Pro Asp Lys Pro Ser Leu Asp
35 40 45
Ile Ser Leu Glu Thr Val Ala Ile Asp Arg Pro Ala Glu Val Arg Lys
50 55 60
Val Cys Tyr Asn Ala Val Leu Thr His Val Lys Ile Asn Asp Lys Cys
65 70 75 80
Pro Ser Thr Gly Glu Ala His Leu Ala Glu Glu Asn Glu Gly Asp Asn
85 90 95
Ala Cys Lys Arg Thr Tyr Ser Asp Arg Gly Trp Gly Asn Gly Cys Gly
100 105 110
Leu Phe Gly Lys Gly Ser Ile Val Ala Cys Ala Lys Phe Thr Cys Ala
115 120 125
Lys Ser Met Ser Leu Phe Glu Val Asp Gln Thr Lys Ile Gln Tyr Val
130 135 140
Ile Arg Ala Gln Leu His Val Gly Ala Lys Gln Glu Asn Trp Asn Thr
145 150 155 160
Asp Ile Lys Thr Leu Lys Phe Asp Ala Leu Ser Gly Ser Gln Glu Val
165 170 175
Glu Phe Ile Gly Tyr Gly Lys Ala Thr Leu Glu Cys Gln Val Gln Thr
180 185 190
Ala Val Asp Phe Gly Asn Ser Tyr Ile Ala Glu Met Glu Thr Glu Ser
195 200 205
Trp Ile Val Asp Arg Gln Trp Ala Gln Asp Leu Thr Leu Pro Trp Gln
210 215 220
Ser Gly Ser Gly Gly Val Trp Arg Glu Met His His Leu Val Glu Phe
225 230 235 240
Glu Pro Pro His Ala Ala Thr Ile Arg Val Leu Ala Leu Gly Asn Gln
245 250 255
Glu Gly Ser Leu Lys Thr Ala Leu Thr Gly Ala Met Arg Val Thr Lys
260 265 270
Asp Thr Asn Asp Asn Asn Leu Tyr Lys Leu His Gly Gly His Val Ser
275 280 285
Cys Arg Val Lys Leu Ser Ala Leu Thr Leu Lys Gly Thr Ser Tyr Lys
290 295 300
Ile Cys Thr Asp Lys Met Phe Phe Val Lys Asn Pro Thr Asp Thr Gly
305 310 315 320
His Gly Thr Val Val Met Gln Val Lys Val Ser Lys Gly Ala Pro Cys
325 330 335
Arg Ile Pro Val Ile Val Ala Asp Asp Leu Thr Ala Ala Ile Asn Lys
340 345 350
Gly Ile Leu Val Thr Val Asn Pro Ile Ala Ser Thr Asn Asp Asp Glu
355 360 365
Val Leu Ile Glu Val Asn Pro Pro Phe Gly Asp Ser Tyr Ile Ile Val
370 375 380
Gly Arg Gly Asp Ser Arg Leu Thr Tyr Gln Trp His Lys Glu Gly Ser
385 390 395 400
Ser Ile Gly Lys Leu Phe Thr Gln Thr Met Lys Gly Val Glu Arg Leu
405 410 415
Ala Val Met Gly Asp Thr Ala Trp Asp Phe Ser Ser Ala Gly Gly Phe
420 425 430
Phe Thr Ser Val Gly Lys Gly Ile His Thr Val Phe Gly Ser Ala Phe
435 440 445
Gln Gly Leu Phe Gly Gly Leu Asn Trp Ile Thr Lys Val Ile Met Gly
450 455 460
Ala Val Leu Ile Trp Val Gly Ile
465 470
<210> 581
<211> 1485
<212> DNA
<213> Flavivirus Dengue virus 2
<400> 581
atgaggtgca tcggcatcag caacagggac ttcgtggagg gcgtgagcgg cggcagctgg 60
gtggacatcg tgctggagca cggcagctgc gtgaccacca tggccaagaa caagcccacc 120
ctggacttcg agctgatcaa gaccgaggcc aagcaccccg ccaccctgag gaagtactgc 180
gtggaggcca agctgaccaa caccaccacc gccagcaggt gccccaccca gggcgagccc 240
agcctgaacg aggagcagga caagaggttc gtgtgcaagc acagcatggt ggacaggggc 300
tggggcaacg gctgcggcct gttcggcaag ggcggcatcg tgacctgcgc catgttcacc 360
tgcaagaaga acatggaggg caaggtggtg cagcccgaga acctggagta caccatcgtg 420
atcacccccc acagcggcga ggagaacgcc gtgggcaacg acaccggcaa gcacggcaag 480
gagatcaagg tgacccccca gagcagcatc accgaggccg agctgaccgg ctacggcacc 540
gtgaccatgg agtgcagccc caggaccggc ctggacttca acgagatggt gctgctgcag 600
atggagaaca aggcctggct ggtgcacagg cagtggttcc tggacctgcc cctgccctgg 660
ctgcccggcg ccgacaccca gggcagcaac tggatccaga aggagaccct ggtgaccttc 720
aagaaccccc acgccaagaa gcaggacgtg gtggtgctgg gcagccagga gggcgccatg 780
cacaccgccc tgaccggcgc caccgagatc cagatgagca gcggcaacct gctgttcacc 840
ggccacctga agtgcaggct gaggatggac aagctgcagc tgaagggcat gagctacagc 900
atgtgcaccg gcaagttcaa ggtggtgaag gagatcgccg agacccagca cggcaccatc 960
gtgatcaggg tgcagtacga gggcgacggc agcccctgca agatcccctt cgagatcatg 1020
gacctggaga agaggcacgt gctgggcagg ctgatcaccg tgaaccccat cgtgaccgag 1080
aaggacagcc ccgtgaacat cgaggccgag ccccccttcg gcgacagcta catcatcatc 1140
ggcgtggagc ccggccagct gaagctgagc tggttcaaga agggcagcag catcggccag 1200
atgttcgaga ccaccatgag gggcgccaag aggatggcca tcctgggcga caccgcctgg 1260
gacttcggca gcctgggcgg cgtgttcacc agcatcggca aggccctgca ccaggtgttc 1320
ggcgccatct acggcgccgc cttcagcggc gtgagctgga ccatgaagat cctgatcggc 1380
gtggtgatca cctggatcgg catgaacagc aggagcacca gcctgagcgt gagcctggtg 1440
ctggtgggcg tggtgaccct gtacctgggc gtgatggtgc aggcc 1485
<210> 582
<211> 495
<212> PRT
<213> Flavivirus Dengue virus 2
<400> 582
Met Arg Cys Ile Gly Ile Ser Asn Arg Asp Phe Val Glu Gly Val Ser
1 5 10 15
Gly Gly Ser Trp Val Asp Ile Val Leu Glu His Gly Ser Cys Val Thr
20 25 30
Thr Met Ala Lys Asn Lys Pro Thr Leu Asp Phe Glu Leu Ile Lys Thr
35 40 45
Glu Ala Lys His Pro Ala Thr Leu Arg Lys Tyr Cys Val Glu Ala Lys
50 55 60
Leu Thr Asn Thr Thr Thr Ala Ser Arg Cys Pro Thr Gln Gly Glu Pro
65 70 75 80
Ser Leu Asn Glu Glu Gln Asp Lys Arg Phe Val Cys Lys His Ser Met
85 90 95
Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Gly
100 105 110
Ile Val Thr Cys Ala Met Phe Thr Cys Lys Lys Asn Met Glu Gly Lys
115 120 125
Val Val Gln Pro Glu Asn Leu Glu Tyr Thr Ile Val Ile Thr Pro His
130 135 140
Ser Gly Glu Glu Asn Ala Val Gly Asn Asp Thr Gly Lys His Gly Lys
145 150 155 160
Glu Ile Lys Val Thr Pro Gln Ser Ser Ile Thr Glu Ala Glu Leu Thr
165 170 175
Gly Tyr Gly Thr Val Thr Met Glu Cys Ser Pro Arg Thr Gly Leu Asp
180 185 190
Phe Asn Glu Met Val Leu Leu Gln Met Glu Asn Lys Ala Trp Leu Val
195 200 205
His Arg Gln Trp Phe Leu Asp Leu Pro Leu Pro Trp Leu Pro Gly Ala
210 215 220
Asp Thr Gln Gly Ser Asn Trp Ile Gln Lys Glu Thr Leu Val Thr Phe
225 230 235 240
Lys Asn Pro His Ala Lys Lys Gln Asp Val Val Val Leu Gly Ser Gln
245 250 255
Glu Gly Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Met
260 265 270
Ser Ser Gly Asn Leu Leu Phe Thr Gly His Leu Lys Cys Arg Leu Arg
275 280 285
Met Asp Lys Leu Gln Leu Lys Gly Met Ser Tyr Ser Met Cys Thr Gly
290 295 300
Lys Phe Lys Val Val Lys Glu Ile Ala Glu Thr Gln His Gly Thr Ile
305 310 315 320
Val Ile Arg Val Gln Tyr Glu Gly Asp Gly Ser Pro Cys Lys Ile Pro
325 330 335
Phe Glu Ile Met Asp Leu Glu Lys Arg His Val Leu Gly Arg Leu Ile
340 345 350
Thr Val Asn Pro Ile Val Thr Glu Lys Asp Ser Pro Val Asn Ile Glu
355 360 365
Ala Glu Pro Pro Phe Gly Asp Ser Tyr Ile Ile Ile Gly Val Glu Pro
370 375 380
Gly Gln Leu Lys Leu Ser Trp Phe Lys Lys Gly Ser Ser Ile Gly Gln
385 390 395 400
Met Phe Glu Thr Thr Met Arg Gly Ala Lys Arg Met Ala Ile Leu Gly
405 410 415
Asp Thr Ala Trp Asp Phe Gly Ser Leu Gly Gly Val Phe Thr Ser Ile
420 425 430
Gly Lys Ala Leu His Gln Val Phe Gly Ala Ile Tyr Gly Ala Ala Phe
435 440 445
Ser Gly Val Ser Trp Thr Met Lys Ile Leu Ile Gly Val Val Ile Thr
450 455 460
Trp Ile Gly Met Asn Ser Arg Ser Thr Ser Leu Ser Val Ser Leu Val
465 470 475 480
Leu Val Gly Val Val Thr Leu Tyr Leu Gly Val Met Val Gln Ala
485 490 495
<210> 583
<211> 1479
<212> DNA
<213> Flavivirus Dengue virus 3
<400> 583
atgaggtgcg tgggcgtggg caacagggac ttcgtggagg gcctgagcgg cgccacctgg 60
gtggacgtgg tgctggagca cggcggctgc gtgaccacca tggccaagaa caagcccacc 120
ctggacatcg agctgcagaa gaccgaggcc acccagctgg ccaccctgag gaagctgtgc 180
atcgagggca agatcaccaa catcaccacc gacagcaggt gccccaccca gggcgaggcc 240
atcctgcccg aggagcagga ccagaactac gtgtgcaagc acacctacgt ggacaggggc 300
tggggcaacg gctgcggcct gttcggcaag ggcagcctgg tgacctgcgc caagttccag 360
tgcctggaga gcatcgaggg caaggtggtg cagcacgaga acctgaagta caccgtgatc 420
atcaccgtgc acaccggcga ccagcaccag gtgggcaacg agacccaggg cgtgaccgcc 480
gagatcacca gccaggccag caccgccgag gccatcctgc ccgagtacgg caccctgggc 540
ctggagtgca gccccaggac cggcctggac ttcaacgaga tgatcctgct gaccatgaag 600
aacaaggcct ggatggtgca caggcagtgg ttcttcgacc tgcccctgcc ctggaccagc 660
ggcgccacca ccaagacccc cacctggaac aggaaggagc tgctggtgac cttcaagaac 720
gcccacgcca agaagcagga ggtggtggtg ctgggcagcc aggagggcgc catgcacacc 780
gccctgaccg gcgccaccga gatccagacc agcggcggca ccagcatctt cgccggccac 840
ctgaagtgca ggctgaagat ggacaagctg aagctgaagg gcatgagcta cgccatgtgc 900
ctgaacacct tcgtgctgaa gaaggaggtg agcgagaccc agcacggcac catcctgatc 960
aaggtggagt acaagggcga ggacgccccc tgcaagatcc ccttcagcac cgaggacggc 1020
cagggcaagg cccacaacgg caggctgatc accgccaacc ccgtggtgac caagaaggag 1080
gagcccgtga acatcgaggc cgagcccccc ttcggcgaga gcaacatcgt gatcggcatc 1140
ggcgacaagg ccctgaagat caactggtac aggaagggca gcagcatcgg caagatgttc 1200
gaggccaccg ccaggggcgc caggaggatg gccatcctgg gcgacaccgc ctgggacttc 1260
ggcagcgtgg gcggcgtgct gaacagcctg ggcaagatgg tgcaccagat cttcggcagc 1320
gcctacaccg ccctgttcag cggcgtgagc tggatcatga agatcggcat cggcgtgctg 1380
ctgacctgga tcggcctgaa cagcaagaac accagcatga gcttcagctg catcgccatc 1440
ggcatcatca ccctgtacct gggcgtggtg gtgcaggcc 1479
<210> 584
<211> 493
<212> PRT
<213> Flavivirus Dengue virus 3
<400> 584
Met Arg Cys Val Gly Val Gly Asn Arg Asp Phe Val Glu Gly Leu Ser
1 5 10 15
Gly Ala Thr Trp Val Asp Val Val Leu Glu His Gly Gly Cys Val Thr
20 25 30
Thr Met Ala Lys Asn Lys Pro Thr Leu Asp Ile Glu Leu Gln Lys Thr
35 40 45
Glu Ala Thr Gln Leu Ala Thr Leu Arg Lys Leu Cys Ile Glu Gly Lys
50 55 60
Ile Thr Asn Ile Thr Thr Asp Ser Arg Cys Pro Thr Gln Gly Glu Ala
65 70 75 80
Ile Leu Pro Glu Glu Gln Asp Gln Asn Tyr Val Cys Lys His Thr Tyr
85 90 95
Val Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser
100 105 110
Leu Val Thr Cys Ala Lys Phe Gln Cys Leu Glu Ser Ile Glu Gly Lys
115 120 125
Val Val Gln His Glu Asn Leu Lys Tyr Thr Val Ile Ile Thr Val His
130 135 140
Thr Gly Asp Gln His Gln Val Gly Asn Glu Thr Gln Gly Val Thr Ala
145 150 155 160
Glu Ile Thr Ser Gln Ala Ser Thr Ala Glu Ala Ile Leu Pro Glu Tyr
165 170 175
Gly Thr Leu Gly Leu Glu Cys Ser Pro Arg Thr Gly Leu Asp Phe Asn
180 185 190
Glu Met Ile Leu Leu Thr Met Lys Asn Lys Ala Trp Met Val His Arg
195 200 205
Gln Trp Phe Phe Asp Leu Pro Leu Pro Trp Thr Ser Gly Ala Thr Thr
210 215 220
Lys Thr Pro Thr Trp Asn Arg Lys Glu Leu Leu Val Thr Phe Lys Asn
225 230 235 240
Ala His Ala Lys Lys Gln Glu Val Val Val Leu Gly Ser Gln Glu Gly
245 250 255
Ala Met His Thr Ala Leu Thr Gly Ala Thr Glu Ile Gln Thr Ser Gly
260 265 270
Gly Thr Ser Ile Phe Ala Gly His Leu Lys Cys Arg Leu Lys Met Asp
275 280 285
Lys Leu Lys Leu Lys Gly Met Ser Tyr Ala Met Cys Leu Asn Thr Phe
290 295 300
Val Leu Lys Lys Glu Val Ser Glu Thr Gln His Gly Thr Ile Leu Ile
305 310 315 320
Lys Val Glu Tyr Lys Gly Glu Asp Ala Pro Cys Lys Ile Pro Phe Ser
325 330 335
Thr Glu Asp Gly Gln Gly Lys Ala His Asn Gly Arg Leu Ile Thr Ala
340 345 350
Asn Pro Val Val Thr Lys Lys Glu Glu Pro Val Asn Ile Glu Ala Glu
355 360 365
Pro Pro Phe Gly Glu Ser Asn Ile Val Ile Gly Ile Gly Asp Lys Ala
370 375 380
Leu Lys Ile Asn Trp Tyr Arg Lys Gly Ser Ser Ile Gly Lys Met Phe
385 390 395 400
Glu Ala Thr Ala Arg Gly Ala Arg Arg Met Ala Ile Leu Gly Asp Thr
405 410 415
Ala Trp Asp Phe Gly Ser Val Gly Gly Val Leu Asn Ser Leu Gly Lys
420 425 430
Met Val His Gln Ile Phe Gly Ser Ala Tyr Thr Ala Leu Phe Ser Gly
435 440 445
Val Ser Trp Ile Met Lys Ile Gly Ile Gly Val Leu Leu Thr Trp Ile
450 455 460
Gly Leu Asn Ser Lys Asn Thr Ser Met Ser Phe Ser Cys Ile Ala Ile
465 470 475 480
Gly Ile Ile Thr Leu Tyr Leu Gly Val Val Val Gln Ala
485 490
<210> 585
<211> 216
<212> DNA
<213> Flavivirus Dengue virus 4
<400> 585
ttcggcagcg tgggcggcct gttcaccagc ctgggcaagg ccgtgcacca ggtgttcggc 60
agcgtgtaca ccaccatgtt cggcggcgtg agctggatga tcaggatcct gatcggcttc 120
ctggtgctgt ggatcggcac caacagcagg aacaccagca tggccatgac ctgcatcgcc 180
gtgggcggca tcaccctgtt cctgggcttc accgtg 216
<210> 586
<211> 72
<212> PRT
<213> Flavivirus Dengue virus 4
<400> 586
Phe Gly Ser Val Gly Gly Leu Phe Thr Ser Leu Gly Lys Ala Val His
1 5 10 15
Gln Val Phe Gly Ser Val Tyr Thr Thr Met Phe Gly Gly Val Ser Trp
20 25 30
Met Ile Arg Ile Leu Ile Gly Phe Leu Val Leu Trp Ile Gly Thr Asn
35 40 45
Ser Arg Asn Thr Ser Met Ala Met Thr Cys Ile Ala Val Gly Gly Ile
50 55 60
Thr Leu Phe Leu Gly Phe Thr Val
65 70
<210> 587
<211> 1503
<212> DNA
<213> Flavivirus Murray Valley encephalitis virus
<400> 587
ttcaactgcc tgggcatgag cagcagggac ttcatcgagg gcgccagcgg cgccacctgg 60
gtggacctgg tgctggaggg cgacagctgc atcaccatca tggccgccga caagcccacc 120
ctggacatca ggatgatgaa catcgaggcc accaacctgg ccctggtgag gaactactgc 180
tacgccgcca ccgtgagcga cgtgagcacc gtgagcaact gccccaccac cggcgagagc 240
cacaacacca agagggccga ccacaactac ctgtgcaaga ggggcgtgac cgacaggggc 300
tggggcaacg gctgcggcct gttcggcaag ggcagcatcg acacctgcgc caagttcacc 360
tgcagcaaca gcgccgccgg caggctgatc ctgcccgagg acatcaagta cgaggtgggc 420
gtgttcgtgc acggcagcac cgacagcacc agccacggca actacagcac ccagatcggc 480
gccaaccagg ccgtgaggtt caccatcagc cccaacgccc ccgccatcac cgccaagatg 540
ggcgactacg gcgaggtgac cgtggagtgc gagcccagga gcggcctgaa caccgaggcc 600
tactacgtga tgaccatcgg caccaagcac ttcctggtgc acagggagtg gttcaacgac 660
ctgctgctgc cctggaccag ccccgccagc accgagtgga ggaacaggga gatcctggtg 720
gagttcgagg agccccacgc caccaagcag agcgtggtgg ccctgggcag ccaggagggc 780
gccctgcacc aggccctggc cggcgccatc cccgtggagt tcagcagcag caccctgaag 840
ctgaccagcg gccacctgaa gtgcagggtg aagatggaga agctgaagct gaagggcacc 900
acctacggca tgtgcaccga gaagttcacc ttcagcaaga accccgccga caccggccac 960
ggcaccgtgg tgctggagct gcagtacacc ggcagcgacg gcccctgcaa gatccccatc 1020
agcagcgtgg ccagcctgaa cgacatgacc cccgtgggca ggatggtgac cgccaacccc 1080
tacgtggcca gcagcaccgc caacgccaag gtgctggtgg agatcgagcc ccccttcggc 1140
gacagctaca tcgtggtggg caggggcgac aagcagatca accaccactg gcacaaggag 1200
ggcagcagca tcggcaaggc cttcagcacc accctgaagg gcgcccagag gctggccgcc 1260
ctgggcgaca ccgcctggga cttcggcagc gtgggcggcg tgttcaacag catcggcaag 1320
gccgtgcacc aggtgttcgg cggcgccttc aggaccctgt tcggcggcat gagctggatc 1380
agccccggcc tgctgggcgc cctgctgctg tggatgggcg tgaacgccag ggacaagagc 1440
atcgccctgg ccttcctggc caccggcggc gtgctgctgt tcctggccac caacgtgcac 1500
gcc 1503
<210> 588
<211> 501
<212> PRT
<213> Flavivirus Murray Valley encephalitis virus
<400> 588
Phe Asn Cys Leu Gly Met Ser Ser Arg Asp Phe Ile Glu Gly Ala Ser
1 5 10 15
Gly Ala Thr Trp Val Asp Leu Val Leu Glu Gly Asp Ser Cys Ile Thr
20 25 30
Ile Met Ala Ala Asp Lys Pro Thr Leu Asp Ile Arg Met Met Asn Ile
35 40 45
Glu Ala Thr Asn Leu Ala Leu Val Arg Asn Tyr Cys Tyr Ala Ala Thr
50 55 60
Val Ser Asp Val Ser Thr Val Ser Asn Cys Pro Thr Thr Gly Glu Ser
65 70 75 80
His Asn Thr Lys Arg Ala Asp His Asn Tyr Leu Cys Lys Arg Gly Val
85 90 95
Thr Asp Arg Gly Trp Gly Asn Gly Cys Gly Leu Phe Gly Lys Gly Ser
100 105 110
Ile Asp Thr Cys Ala Lys Phe Thr Cys Ser Asn Ser Ala Ala Gly Arg
115 120 125
Leu Ile Leu Pro Glu Asp Ile Lys Tyr Glu Val Gly Val Phe Val His
130 135 140
Gly Ser Thr Asp Ser Thr Ser His Gly Asn Tyr Ser Thr Gln Ile Gly
145 150 155 160
Ala Asn Gln Ala Val Arg Phe Thr Ile Ser Pro Asn Ala Pro Ala Ile
165 170 175
Thr Ala Lys Met Gly Asp Tyr Gly Glu Val Thr Val Glu Cys Glu Pro
180 185 190
Arg Ser Gly Leu Asn Thr Glu Ala Tyr Tyr Val Met Thr Ile Gly Thr
195 200 205
Lys His Phe Leu Val His Arg Glu Trp Phe Asn Asp Leu Leu Leu Pro
210 215 220
Trp Thr Ser Pro Ala Ser Thr Glu Trp Arg Asn Arg Glu Ile Leu Val
225 230 235 240
Glu Phe Glu Glu Pro His Ala Thr Lys Gln Ser Val Val Ala Leu Gly
245 250 255
Ser Gln Glu Gly Ala Leu His Gln Ala Leu Ala Gly Ala Ile Pro Val
260 265 270
Glu Phe Ser Ser Ser Thr Leu Lys Leu Thr Ser Gly His Leu Lys Cys
275 280 285
Arg Val Lys Met Glu Lys Leu Lys Leu Lys Gly Thr Thr Tyr Gly Met
290 295 300
Cys Thr Glu Lys Phe Thr Phe Ser Lys Asn Pro Ala Asp Thr Gly His
305 310 315 320
Gly Thr Val Val Leu Glu Leu Gln Tyr Thr Gly Ser Asp Gly Pro Cys
325 330 335
Lys Ile Pro Ile Ser Ser Val Ala Ser Leu Asn Asp Met Thr Pro Val
340 345 350
Gly Arg Met Val Thr Ala Asn Pro Tyr Val Ala Ser Ser Thr Ala Asn
355 360 365
Ala Lys Val Leu Val Glu Ile Glu Pro Pro Phe Gly Asp Ser Tyr Ile
370 375 380
Val Val Gly Arg Gly Asp Lys Gln Ile Asn His His Trp His Lys Glu
385 390 395 400
Gly Ser Ser Ile Gly Lys Ala Phe Ser Thr Thr Leu Lys Gly Ala Gln
405 410 415
Arg Leu Ala Ala Leu Gly Asp Thr Ala Trp Asp Phe Gly Ser Val Gly
420 425 430
Gly Val Phe Asn Ser Ile Gly Lys Ala Val His Gln Val Phe Gly Gly
435 440 445
Ala Phe Arg Thr Leu Phe Gly Gly Met Ser Trp Ile Ser Pro Gly Leu
450 455 460
Leu Gly Ala Leu Leu Leu Trp Met Gly Val Asn Ala Arg Asp Lys Ser
465 470 475 480
Ile Ala Leu Ala Phe Leu Ala Thr Gly Gly Val Leu Leu Phe Leu Ala
485 490 495
Thr Asn Val His Ala
500
<210> 589
<211> 1491
<212> DNA
<213> Flavivirus Powassan virus
<400> 589
accaggtgca cccacctgga gaacagggac ttcgtgaccg gcacccaggg caccaccagg 60
gtgagcctgg tgctggagct gggcggctgc gtgaccatca ccgccgaggg caagcccagc 120
atcgacgtgt ggctggagga catcttccag gagagccccg ccgagaccag ggagtactgc 180
ctgcacgcca agctgaccaa caccaaggtg gaggccaggt gccccaccac cggccccgcc 240
accctgcccg aggagcacca ggccaacatg gtgtgcaaga gggaccagag cgacaggggc 300
tggggcaacc actgcggctt cttcggcaag ggcagcatcg tggcctgcgc caagttcgag 360
tgcgaggagg ccaagaaggc catgggccac gtgtacgaca gcaccaagat cacctacgtg 420
gtgaaggtgg agccccacac cggcgactac ctggccgcca acgagaccaa cagcaacagg 480
aagagcgccc agttcaccgt ggccagcgag aaggtgatcc tgaggctggg cgactacggc 540
gacgtgagcc tgacctgcaa ggtggccagc ggcatcgacg tggcccagac cgtggtgatg 600
agcctggaca gcagcaagga ccacctgccc agcgcctggc aggtgcacag ggactggttc 660
gaggacctgg ccctgccctg gaagcacaag gacaaccagg actggaacag cgtggagaag 720
ctggtggagt tcggcccccc ccacgccgtg aagatggacg tgttcaacct gggcgaccag 780
accgccgtgc tgctgaagag cctggccggc gtgcccctgg ccagcgtgga gggccagaag 840
taccacctga agagcggcca cgtgacctgc gacgtgggcc tggagaagct gaagctgaag 900
ggcaccacct acagcatgtg cgacaaggcc aagttcaagt ggaagagggt gcccgtggac 960
agcggccacg acaccgtggt gatggaggtg agctacaccg gcagcgacaa gccctgcagg 1020
atccccgtga gggccgtggc ccacggcgtg cccgccgtga acgtggccat gctgatcacc 1080
cccaacccca ccatcgagac caacggcggc ggcttcatcg agatgcagct gccccccggc 1140
gacaacatca tctacgtggg cgacctgagc cagcagtggt tccagaaggg cagcaccatc 1200
ggcaggatgt tcgagaagac caggaggggc ctggagaggc tgagcgtggt gggcgagcac 1260
gcctgggact tcggcagcgt gggcggcgtg ctgagcagcg tgggcaaggc catccacacc 1320
gtgctgggcg gcgccttcaa caccctgttc ggcggcgtgg gcttcatccc caagatgctg 1380
ctgggcgtgg ccctggtgtg gctgggcctg aacgccagga accccaccat gagcatgacc 1440
ttcctggccg tgggcgccct gaccctgatg atgaccatgg gcgtgggcgc c 1491
<210> 590
<211> 497
<212> PRT
<213> Flavivirus Powassan virus
<400> 590
Thr Arg Cys Thr His Leu Glu Asn Arg Asp Phe Val Thr Gly Thr Gln
1 5 10 15
Gly Thr Thr Arg Val Ser Leu Val Leu Glu Leu Gly Gly Cys Val Thr
20 25 30
Ile Thr Ala Glu Gly Lys Pro Ser Ile Asp Val Trp Leu Glu Asp Ile
35 40 45
Phe Gln Glu Ser Pro Ala Glu Thr Arg Glu Tyr Cys Leu His Ala Lys
50 55 60
Leu Thr Asn Thr Lys Val Glu Ala Arg Cys Pro Thr Thr Gly Pro Ala
65 70 75 80
Thr Leu Pro Glu Glu His Gln Ala Asn Met Val Cys Lys Arg Asp Gln
85 90 95
Ser Asp Arg Gly Trp Gly Asn His Cys Gly Phe Phe Gly Lys Gly Ser
100 105 110
Ile Val Ala Cys Ala Lys Phe Glu Cys Glu Glu Ala Lys Lys Ala Met
115 120 125
Gly His Val Tyr Asp Ser Thr Lys Ile Thr Tyr Val Val Lys Val Glu
130 135 140
Pro His Thr Gly Asp Tyr Leu Ala Ala Asn Glu Thr Asn Ser Asn Arg
145 150 155 160
Lys Ser Ala Gln Phe Thr Val Ala Ser Glu Lys Val Ile Leu Arg Leu
165 170 175
Gly Asp Tyr Gly Asp Val Ser Leu Thr Cys Lys Val Ala Ser Gly Ile
180 185 190
Asp Val Ala Gln Thr Val Val Met Ser Leu Asp Ser Ser Lys Asp His
195 200 205
Leu Pro Ser Ala Trp Gln Val His Arg Asp Trp Phe Glu Asp Leu Ala
210 215 220
Leu Pro Trp Lys His Lys Asp Asn Gln Asp Trp Asn Ser Val Glu Lys
225 230 235 240
Leu Val Glu Phe Gly Pro Pro His Ala Val Lys Met Asp Val Phe Asn
245 250 255
Leu Gly Asp Gln Thr Ala Val Leu Leu Lys Ser Leu Ala Gly Val Pro
260 265 270
Leu Ala Ser Val Glu Gly Gln Lys Tyr His Leu Lys Ser Gly His Val
275 280 285
Thr Cys Asp Val Gly Leu Glu Lys Leu Lys Leu Lys Gly Thr Thr Tyr
290 295 300
Ser Met Cys Asp Lys Ala Lys Phe Lys Trp Lys Arg Val Pro Val Asp
305 310 315 320
Ser Gly His Asp Thr Val Val Met Glu Val Ser Tyr Thr Gly Ser Asp
325 330 335
Lys Pro Cys Arg Ile Pro Val Arg Ala Val Ala His Gly Val Pro Ala
340 345 350
Val Asn Val Ala Met Leu Ile Thr Pro Asn Pro Thr Ile Glu Thr Asn
355 360 365
Gly Gly Gly Phe Ile Glu Met Gln Leu Pro Pro Gly Asp Asn Ile Ile
370 375 380
Tyr Val Gly Asp Leu Ser Gln Gln Trp Phe Gln Lys Gly Ser Thr Ile
385 390 395 400
Gly Arg Met Phe Glu Lys Thr Arg Arg Gly Leu Glu Arg Leu Ser Val
405 410 415
Val Gly Glu His Ala Trp Asp Phe Gly Ser Val Gly Gly Val Leu Ser
420 425 430
Ser Val Gly Lys Ala Ile His Thr Val Leu Gly Gly Ala Phe Asn Thr
435 440 445
Leu Phe Gly Gly Val Gly Phe Ile Pro Lys Met Leu Leu Gly Val Ala
450 455 460
Leu Val Trp Leu Gly Leu Asn Ala Arg Asn Pro Thr Met Ser Met Thr
465 470 475 480
Phe Leu Ala Val Gly Ala Leu Thr Leu Met Met Thr Met Gly Val Gly
485 490 495
Ala
<210> 591
<211> 1692
<212> DNA
<213> Alphainfluenzavirus Influenza A virus H5N1
<400> 591
atggagagga tcgtgctgct gctggccatc gtgagcctgg tgaagagcga ccagatctgc 60
atcggctacc acgccaacaa gagcaccaag caggtggaca ccatcatgga gaagaacgtg 120
accgtgaccc acgcccagga catcctggag aggacccaca acggcaagct gtgcagcctg 180
aacggcgtga agcccctgat cctgagggac tgcagcgtgg ccggctggct gctgggcaac 240
cccatgtgcg acgagttcct gaacgtgccc gagtggagct acatcgtgga gaaggacaac 300
cccatcaaca gcctgtgcta ccccggcgac ttcaacgact acgaggagct gaagcacctg 360
ctgagcagca ccaaccactt cgagaagatc cagatcatcc ccaggagcag ctggagcaac 420
cacgacgcca gcagcggcgt gagcagcgcc tgcccctaca tcggcaggag cagcttcttc 480
aggaacgtgg tgtggctgat caagaaggac aacgcctacc ccaccatcaa gaggagctac 540
aacaacacca accaggagga cctgctgatc ctgtggggca tccaccaccc caacgacgcc 600
gccgagcaga ccaagctgta ccagaacccc accacctacg tgagcgtggg caccagcacc 660
ctgaaccaga ggagcatccc cgagatcgcc accaggccca aggtgaacgg ccagagcggc 720
aggatggagt tcttctggac catcctgaag cccaacgacg ccatcaactt cgagagcaac 780
ggcaacttca tcgcccccga gtacgcctac aagatcgtga agaagggcga cagcgccatc 840
atgaagagcg gcctggccta cggcaactgc gacaccaagt gccagacccc cgtgggcgcc 900
atcaacagca gcatgccctt ccacaacatc cacccccaca ccatcggcga gtgccccaag 960
tacgtgaaga gcgacaggct ggtgctggcc accggcctga ggaacgtgcc ccagaggaag 1020
aagaggggcc tgttcggcgc catcgccggc ttcatcgagg gcggctggca gggcatggtg 1080
gacggctggt acggctacca ccacagcaac gagcagggca gcggctacgc cgccgacaag 1140
gagagcaccc agaaggccat cgacggcatc accaacaagg tgaacagcat catcgacaag 1200
atgaacaccc agttcaaggc cgtgggcaag gagttcaaca acctggagag gagggtggag 1260
aacctgaaca agaagatgga ggacggcttc ctggacgtgt ggacctacaa cgtggagctg 1320
ctggtgctga tggagaacga gaggaccctg gacttccacg acagcaacgt gaagaacctg 1380
tacgacaagg tgaggctgca gctgaaggac aacgccaggg agctgggcaa cggctgcttc 1440
gagttctacc acaagtgcga caacgagtgc atggagagcg tgaggaacgg cacctacgac 1500
tacccccagt acagcgagga ggccaggctg aacagggagg agatcagcgg cgtgaagctg 1560
gagagcatgg gcgtgtacca gatcctgagc atctacagca ccgtggccag cagcctggcc 1620
ctggccatca tgatcgccgg cctgagcttc tggatgtgca gcaacggcag cctgcagtgc 1680
aggatctgca tc 1692
<210> 592
<211> 564
<212> PRT
<213> Alphainfluenzavirus Influenza A virus H5N1
<400> 592
Met Glu Arg Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser
1 5 10 15
Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Lys Ser Thr Lys Gln Val
20 25 30
Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile
35 40 45
Leu Glu Arg Thr His Asn Gly Lys Leu Cys Ser Leu Asn Gly Val Lys
50 55 60
Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn
65 70 75 80
Pro Met Cys Asp Glu Phe Leu Asn Val Pro Glu Trp Ser Tyr Ile Val
85 90 95
Glu Lys Asp Asn Pro Ile Asn Ser Leu Cys Tyr Pro Gly Asp Phe Asn
100 105 110
Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Thr Asn His Phe Glu
115 120 125
Lys Ile Gln Ile Ile Pro Arg Ser Ser Trp Ser Asn His Asp Ala Ser
130 135 140
Ser Gly Val Ser Ser Ala Cys Pro Tyr Ile Gly Arg Ser Ser Phe Phe
145 150 155 160
Arg Asn Val Val Trp Leu Ile Lys Lys Asp Asn Ala Tyr Pro Thr Ile
165 170 175
Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Ile Leu Trp
180 185 190
Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln
195 200 205
Asn Pro Thr Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Gln Arg
210 215 220
Ser Ile Pro Glu Ile Ala Thr Arg Pro Lys Val Asn Gly Gln Ser Gly
225 230 235 240
Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn
245 250 255
Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile
260 265 270
Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Gly Leu Ala Tyr Gly
275 280 285
Asn Cys Asp Thr Lys Cys Gln Thr Pro Val Gly Ala Ile Asn Ser Ser
290 295 300
Met Pro Phe His Asn Ile His Pro His Thr Ile Gly Glu Cys Pro Lys
305 310 315 320
Tyr Val Lys Ser Asp Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Val
325 330 335
Pro Gln Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile
340 345 350
Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His
355 360 365
Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln
370 375 380
Lys Ala Ile Asp Gly Ile Thr Asn Lys Val Asn Ser Ile Ile Asp Lys
385 390 395 400
Met Asn Thr Gln Phe Lys Ala Val Gly Lys Glu Phe Asn Asn Leu Glu
405 410 415
Arg Arg Val Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp
420 425 430
Val Trp Thr Tyr Asn Val Glu Leu Leu Val Leu Met Glu Asn Glu Arg
435 440 445
Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val
450 455 460
Arg Leu Gln Leu Lys Asp Asn Ala Arg Glu Leu Gly Asn Gly Cys Phe
465 470 475 480
Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn
485 490 495
Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Asn Arg
500 505 510
Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln Ile
515 520 525
Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met
530 535 540
Ile Ala Gly Leu Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys
545 550 555 560
Arg Ile Cys Ile
<210> 593
<211> 1680
<212> DNA
<213> Alphainfluenzavirus Influenza A virus H7N9
<400> 593
atgaacaccc agatcctggt gttcgccctg atcgccatca tccccaccaa cgccgacaag 60
atctgcctgg gccaccacgc cgtgagcaac ggcaccaagg tgaacaccct gaccgagagg 120
ggcgtggagg tggtgaacgc caccgagacc gtggagagga ccaacatccc caggatctgc 180
agcaagggca agaggaccgt ggacctgggc cagtgcggcc tgctgggcac catcaccggc 240
cccccccagt gcgaccagtt cctggagttc agcgccgacc tgatcatcga gaggagggag 300
ggcagcgacg tgtgctaccc cggcaagttc gtgaacgagg aggccctgag gcagatcctg 360
agggagagcg gcggcatcga caaggaggcc atgggcttca cctacagcgg catcaggacc 420
aacggcgcca ccagcgcctg caggaggagc ggcagcagct tctacgccga gatgaagtgg 480
ctgctgagca acaccgacaa cgccgccttc ccccagatga ccaagagcta caagaacacc 540
aggaagagcc ccgccctgat cgtgtggggc atccaccaca gcgtgagcac cgccgagcag 600
accaagctgt acggcagcgg caacaagctg gtgaccgtgg gcagcagcaa ctaccagcag 660
agcttcgtgc ccagccccgg cgccaggccc caggtgaacg gcatcagcgg caggatcgac 720
ttccactggc tgatgctgaa ccccaacgac accgtgacct tcagcttcaa cggcgccttc 780
atcgcccccg acagggccag cttcctgagg ggcaagagca tgggcatcca gagcggcgtg 840
caggtggacg ccaactgcga gggcgactgc taccacagcg gcggcaccat catcagcaac 900
ctgcccttcc agaacatcga cagcagggcc gtgggcaagt gccccaggta cgtgaagcag 960
aggagcctgc tgctggccac cggcatgaag aacgtgcccg agatccccaa gggcaggggc 1020
ctgttcggcg ccatcgccgg cttcatcgag aacggctggg agggcctgat cgacggctgg 1080
tacggcttca ggcaccagaa cgcccagggc gagggcaccg ccgccgacta caagagcacc 1140
cagagcgcca tcgaccagat caccggcaag ctgaacaggc tgatcgagaa gaccaaccag 1200
cagttcgagc tgatcgacaa cgagttcaac gaggtggaga agcagatcgg caacgtgatc 1260
aactggacca gggacagcat caccgaggtg tggagctaca acgccgagct gctggtggcc 1320
atggagaacc agcacaccat cgacctggcc gacagcgaga tggacaagct gtacgagagg 1380
gtgaagaggc agctgaggga gaacgccgag gaggacggca ccggctgctt cgagatcttc 1440
cacaagtgcg acgacgactg catggccagc atcaggaaca acacctacga ccacagcaag 1500
tacagggagg aggccatgca gaacaggatc cagatcgacc ccgtgaagct gagcagcggc 1560
tacaaggacg tgatcctgtg gttcagcttc ggcgccagct gcttcatcct gctggccatc 1620
gtgatgggcc tggtgttcat ctgcgtgaag aacggcaaca tgaggtgcac catctgcatc 1680
<210> 594
<211> 560
<212> PRT
<213> Alphainfluenzavirus Influenza A virus H7N9
<400> 594
Met Asn Thr Gln Ile Leu Val Phe Ala Leu Ile Ala Ile Ile Pro Thr
1 5 10 15
Asn Ala Asp Lys Ile Cys Leu Gly His His Ala Val Ser Asn Gly Thr
20 25 30
Lys Val Asn Thr Leu Thr Glu Arg Gly Val Glu Val Val Asn Ala Thr
35 40 45
Glu Thr Val Glu Arg Thr Asn Ile Pro Arg Ile Cys Ser Lys Gly Lys
50 55 60
Arg Thr Val Asp Leu Gly Gln Cys Gly Leu Leu Gly Thr Ile Thr Gly
65 70 75 80
Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe Ser Ala Asp Leu Ile Ile
85 90 95
Glu Arg Arg Glu Gly Ser Asp Val Cys Tyr Pro Gly Lys Phe Val Asn
100 105 110
Glu Glu Ala Leu Arg Gln Ile Leu Arg Glu Ser Gly Gly Ile Asp Lys
115 120 125
Glu Ala Met Gly Phe Thr Tyr Ser Gly Ile Arg Thr Asn Gly Ala Thr
130 135 140
Ser Ala Cys Arg Arg Ser Gly Ser Ser Phe Tyr Ala Glu Met Lys Trp
145 150 155 160
Leu Leu Ser Asn Thr Asp Asn Ala Ala Phe Pro Gln Met Thr Lys Ser
165 170 175
Tyr Lys Asn Thr Arg Lys Ser Pro Ala Leu Ile Val Trp Gly Ile His
180 185 190
His Ser Val Ser Thr Ala Glu Gln Thr Lys Leu Tyr Gly Ser Gly Asn
195 200 205
Lys Leu Val Thr Val Gly Ser Ser Asn Tyr Gln Gln Ser Phe Val Pro
210 215 220
Ser Pro Gly Ala Arg Pro Gln Val Asn Gly Ile Ser Gly Arg Ile Asp
225 230 235 240
Phe His Trp Leu Met Leu Asn Pro Asn Asp Thr Val Thr Phe Ser Phe
245 250 255
Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala Ser Phe Leu Arg Gly Lys
260 265 270
Ser Met Gly Ile Gln Ser Gly Val Gln Val Asp Ala Asn Cys Glu Gly
275 280 285
Asp Cys Tyr His Ser Gly Gly Thr Ile Ile Ser Asn Leu Pro Phe Gln
290 295 300
Asn Ile Asp Ser Arg Ala Val Gly Lys Cys Pro Arg Tyr Val Lys Gln
305 310 315 320
Arg Ser Leu Leu Leu Ala Thr Gly Met Lys Asn Val Pro Glu Ile Pro
325 330 335
Lys Gly Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly
340 345 350
Trp Glu Gly Leu Ile Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ala
355 360 365
Gln Gly Glu Gly Thr Ala Ala Asp Tyr Lys Ser Thr Gln Ser Ala Ile
370 375 380
Asp Gln Ile Thr Gly Lys Leu Asn Arg Leu Ile Glu Lys Thr Asn Gln
385 390 395 400
Gln Phe Glu Leu Ile Asp Asn Glu Phe Asn Glu Val Glu Lys Gln Ile
405 410 415
Gly Asn Val Ile Asn Trp Thr Arg Asp Ser Ile Thr Glu Val Trp Ser
420 425 430
Tyr Asn Ala Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp
435 440 445
Leu Ala Asp Ser Glu Met Asp Lys Leu Tyr Glu Arg Val Lys Arg Gln
450 455 460
Leu Arg Glu Asn Ala Glu Glu Asp Gly Thr Gly Cys Phe Glu Ile Phe
465 470 475 480
His Lys Cys Asp Asp Asp Cys Met Ala Ser Ile Arg Asn Asn Thr Tyr
485 490 495
Asp His Ser Lys Tyr Arg Glu Glu Ala Met Gln Asn Arg Ile Gln Ile
500 505 510
Asp Pro Val Lys Leu Ser Ser Gly Tyr Lys Asp Val Ile Leu Trp Phe
515 520 525
Ser Phe Gly Ala Ser Cys Phe Ile Leu Leu Ala Ile Val Met Gly Leu
530 535 540
Val Phe Ile Cys Val Lys Asn Gly Asn Met Arg Cys Thr Ile Cys Ile
545 550 555 560
<210> 595
<211> 1821
<212> DNA
<213> Morbillivirus Canine Distemper Virus
<400> 595
atgctgagct accaggacaa ggtgggcgcc ttctacaagg acaacgccag ggccaacagc 60
agcaagctga gcctggtgac cgaggagcag ggcggcagga ggccccccta cctgctgttc 120
gtgctgctga tcctgctggt gggcatcatg gccctgctgg ccatcaccgg cgtgaggttc 180
caccaggtga gcaccagcaa catggagttc agcaggctgc tgaaggagga catggagaag 240
agcgaggccg tgcaccacca ggtgatcgac gtgctgaccc ccctgttcaa gatcatcggc 300
gacgaggtgg gcctgaggct gccccagaag ctgaacgaga tcaagcagtt catcctgcag 360
aagaccaact tcttcaaccc caacagggag ttcgacttca gggacctgca ctggtgcatc 420
aaccccccca gcaagatcaa ggtgaacttc accaactact gcgacaccat cggcatcagg 480
aagagcatcg ccagcgccgc caaccccatc ctgctgagcg cccacaccgg cggcaggggc 540
gacatcttcc ccccctacag gtgcagcggc gccaccacca gcgtgggcag ggtgttcccc 600
ctgagcgtga gcctgagcat gagcctgatc agcaggacca gcgagatcat caacatgctg 660
accgccatca gcgacggcgt gtacggcaag acctacctgc tggtgcccga ctacatcgag 720
ggcgagttcg acacccagaa gatcagggtg ttcgagatcg gcttcatcaa gaggtggctg 780
aacgacatgc ccctgctgca gaccaccaac tacatggtgc tgcccgagaa cagcaaggcc 840
aaggtgtgca ccatcgccgt gggcgagctg accctggcca gcctgtgcgt ggacgagagc 900
accatcctgc tgtaccacga cagcaacggc agccaggacg gcatcctggt ggtgaccctg 960
ggcatcttcg gcgccacccc catggaccag gtggaggagg tgatccccgt ggcccacccc 1020
agcgtggaga agatccacat caccaaccac aggggcttca tcaaggacag catcgccacc 1080
tggatggtgc ccgccctggt gagcgagaag caggaggagc agaagagctg cctggagagc 1140
gcctgccaga ggaagagcta ccccatgtgc aaccagacca gctgggagcc cttcggcggc 1200
ggccagctgc ccagctacgg caggctgacc ctgcccctgg accccagcat cgacctgcag 1260
ctgaacatca gcttcaccta cggccccgtg atcctgaacg gcaacggcat ggactactac 1320
gagagccccc tgctgggcag cggctggctg accatccccc ccaagaacgg caccgtgctg 1380
ggcctgatca acaaggccgg caggggcgac cagttcaccg tgatccccca cgtgctgacc 1440
ttcgccccca gggagagcag cggcaactgc tacctgccca tccagaccag ccagatcatg 1500
gacaaggacg tgctgaccga gagcaacctg gtggtgctgc ccacccagaa cttcaggtac 1560
gtgatcgcca cctacgacat cagcaggggc gaccacgcca tcgtgtacta cgtgtacgac 1620
cccatcagga ccatcagcta cacccacccc ttcaggctga ccaccaaggg caggcccgac 1680
ttcctgagga tcgagtgctt cgtgtgggac gacgacctgt ggtgccacca gttctacagg 1740
ttcgagaccg acagcaccaa cagcaccacc agcgtggaga acctggtgag gatcaggttc 1800
agctgcagca ggagcaagcc c 1821
<210> 596
<211> 607
<212> PRT
<213> Morbillivirus Canine Distemper Virus
<400> 596
Met Leu Ser Tyr Gln Asp Lys Val Gly Ala Phe Tyr Lys Asp Asn Ala
1 5 10 15
Arg Ala Asn Ser Ser Lys Leu Ser Leu Val Thr Glu Glu Gln Gly Gly
20 25 30
Arg Arg Pro Pro Tyr Leu Leu Phe Val Leu Leu Ile Leu Leu Val Gly
35 40 45
Ile Met Ala Leu Leu Ala Ile Thr Gly Val Arg Phe His Gln Val Ser
50 55 60
Thr Ser Asn Met Glu Phe Ser Arg Leu Leu Lys Glu Asp Met Glu Lys
65 70 75 80
Ser Glu Ala Val His His Gln Val Ile Asp Val Leu Thr Pro Leu Phe
85 90 95
Lys Ile Ile Gly Asp Glu Val Gly Leu Arg Leu Pro Gln Lys Leu Asn
100 105 110
Glu Ile Lys Gln Phe Ile Leu Gln Lys Thr Asn Phe Phe Asn Pro Asn
115 120 125
Arg Glu Phe Asp Phe Arg Asp Leu His Trp Cys Ile Asn Pro Pro Ser
130 135 140
Lys Ile Lys Val Asn Phe Thr Asn Tyr Cys Asp Thr Ile Gly Ile Arg
145 150 155 160
Lys Ser Ile Ala Ser Ala Ala Asn Pro Ile Leu Leu Ser Ala His Thr
165 170 175
Gly Gly Arg Gly Asp Ile Phe Pro Pro Tyr Arg Cys Ser Gly Ala Thr
180 185 190
Thr Ser Val Gly Arg Val Phe Pro Leu Ser Val Ser Leu Ser Met Ser
195 200 205
Leu Ile Ser Arg Thr Ser Glu Ile Ile Asn Met Leu Thr Ala Ile Ser
210 215 220
Asp Gly Val Tyr Gly Lys Thr Tyr Leu Leu Val Pro Asp Tyr Ile Glu
225 230 235 240
Gly Glu Phe Asp Thr Gln Lys Ile Arg Val Phe Glu Ile Gly Phe Ile
245 250 255
Lys Arg Trp Leu Asn Asp Met Pro Leu Leu Gln Thr Thr Asn Tyr Met
260 265 270
Val Leu Pro Glu Asn Ser Lys Ala Lys Val Cys Thr Ile Ala Val Gly
275 280 285
Glu Leu Thr Leu Ala Ser Leu Cys Val Asp Glu Ser Thr Ile Leu Leu
290 295 300
Tyr His Asp Ser Asn Gly Ser Gln Asp Gly Ile Leu Val Val Thr Leu
305 310 315 320
Gly Ile Phe Gly Ala Thr Pro Met Asp Gln Val Glu Glu Val Ile Pro
325 330 335
Val Ala His Pro Ser Val Glu Lys Ile His Ile Thr Asn His Arg Gly
340 345 350
Phe Ile Lys Asp Ser Ile Ala Thr Trp Met Val Pro Ala Leu Val Ser
355 360 365
Glu Lys Gln Glu Glu Gln Lys Ser Cys Leu Glu Ser Ala Cys Gln Arg
370 375 380
Lys Ser Tyr Pro Met Cys Asn Gln Thr Ser Trp Glu Pro Phe Gly Gly
385 390 395 400
Gly Gln Leu Pro Ser Tyr Gly Arg Leu Thr Leu Pro Leu Asp Pro Ser
405 410 415
Ile Asp Leu Gln Leu Asn Ile Ser Phe Thr Tyr Gly Pro Val Ile Leu
420 425 430
Asn Gly Asn Gly Met Asp Tyr Tyr Glu Ser Pro Leu Leu Gly Ser Gly
435 440 445
Trp Leu Thr Ile Pro Pro Lys Asn Gly Thr Val Leu Gly Leu Ile Asn
450 455 460
Lys Ala Gly Arg Gly Asp Gln Phe Thr Val Ile Pro His Val Leu Thr
465 470 475 480
Phe Ala Pro Arg Glu Ser Ser Gly Asn Cys Tyr Leu Pro Ile Gln Thr
485 490 495
Ser Gln Ile Met Asp Lys Asp Val Leu Thr Glu Ser Asn Leu Val Val
500 505 510
Leu Pro Thr Gln Asn Phe Arg Tyr Val Ile Ala Thr Tyr Asp Ile Ser
515 520 525
Arg Gly Asp His Ala Ile Val Tyr Tyr Val Tyr Asp Pro Ile Arg Thr
530 535 540
Ile Ser Tyr Thr His Pro Phe Arg Leu Thr Thr Lys Gly Arg Pro Asp
545 550 555 560
Phe Leu Arg Ile Glu Cys Phe Val Trp Asp Asp Asp Leu Trp Cys His
565 570 575
Gln Phe Tyr Arg Phe Glu Thr Asp Ser Thr Asn Ser Thr Thr Ser Val
580 585 590
Glu Asn Leu Val Arg Ile Arg Phe Ser Cys Ser Arg Ser Lys Pro
595 600 605
<210> 597
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 597
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108
<210> 598
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 598
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcugcu cgacgcgucc ucgagcagaa gcaucaaag 99
<210> 599
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 599
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcugcu cgcuccguuc gagcagaagc aucaaag 97
<210> 600
<211> 91
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 600
guacuggcgc uuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcccu cuucggaggg aagcaucaaa g 91
<210> 601
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 601
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcagga guuucuaugg aaacccugaa gcaucaaag 99
<210> 602
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 602
guacuggcgc cuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99
<210> 603
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 603
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcugcg cuugcgcaga agcaucaaag 90
<210> 604
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 604
uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 605
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 605
uacuggcgcu uuuaucgcau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 606
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 606
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga cuucgguccg auaaauaaga agcaucaaag 110
<210> 607
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 607
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcacau gaggauuacc caugugaagc aucaaag 97
<210> 608
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 608
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuauu uaucgugaga aauccgauaa auaagaagca ucaaag 106
<210> 609
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 609
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcugca ugucuaagac agcagaagca ucaaag 96
<210> 610
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 610
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaggg cuucggccga agcaucaaag 90
<210> 611
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 611
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaauc cauugcacuc cggauugaag caucaaag 98
<210> 612
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 612
uacuggcgcu uuucucgcau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 613
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 613
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggacu ucgguccgau aaauaagaag caucaaag 108
<210> 614
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 614
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcugcu cguuugcggc uacgagcaga agcaucaaag 100
<210> 615
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 615
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucgagag auaaauaaga agcaucaaag 100
<210> 616
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 616
uacggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuauu uaucggagag aaauccgaua aauaagaagc aucaaag 107
<210> 617
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 617
uacuggcgcc uuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99
<210> 618
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 618
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaucggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 619
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 619
uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggacu ucgguccgau aaauaagaag caucaaag 108
<210> 620
<211> 105
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 620
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucgagaa auccgauaaa uaagaagcau caaag 105
<210> 621
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 621
gcgcuuuuau cucauuacuu ugagagccau caccagcgac uaugucguau ggguaaagcg 60
cuuauuuauc ggagagaaau ccgauaaaua agaagcauca aag 103
<210> 622
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 622
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gagauaaaua agaagcauca aag 103
<210> 623
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 623
uacuggcgcu uuuaucucau uacuuuggag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua uuuaucggag aguauccgau aaauaagaag caucaaag 108
<210> 624
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 624
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu ucguaugggu 60
aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 625
<211> 105
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 625
agcgcuuuua ucucauuacu uugagagcca ucaccagcga cuaugucgua uggguaaagc 60
gcuuauuuau cggagagaaa ugccgauaaa uaagaagcau caaag 105
<210> 626
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 626
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaaauaagaa gcaucaaag 109
<210> 627
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 627
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uguaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 628
<211> 102
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 628
gcgcuuuuau cucauuacuu ugagagccau caccagcgac uaugucguau ggguaaagcg 60
cuuauuuauc ggacuucggu ccgauaaaua agcgcaucaa ag 102
<210> 629
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 629
uacuggcgcu uuucucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 630
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 630
guggcgcuuu uaucucauua cuuugagagc caucaccagc gacuaugucg uauggguaaa 60
gcgcuuauuu aucggagaga aauccgauaa auaagaagca ucaaag 106
<210> 631
<211> 110
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 631
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgaccuuau gucguauggg 60
uaaagcgcuu auuuaucgga gagaaauccg auaaauaaga agcaucaaag 110
<210> 632
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 632
gauggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuauu uaucggacuu cgguccgaua aauaagaagc aucaaag 107
<210> 633
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 633
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaaagaagca ucaaag 106
<210> 634
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 634
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgaucuaug ucguaugggu 60
aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 635
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 635
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aaggcuuauu uaucggagag aaauccgaua aaaagaagca ucaaag 106
<210> 636
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 636
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaaaagaagc aucaaag 107
<210> 637
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 637
uacuggcgcu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuauu uaucggacuu cgguccgaua aauaagaagc aucaaag 107
<210> 638
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 638
cggcgcuuuu cucgcauuac uuugagagcc aucaccagcg acuaugucgu auggguaaag 60
cgcuuauugu aucgagagau aaauaagaag caucaaag 98
<210> 639
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 639
cacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuucggagag aaauccgaua aauaagaagc aucaaag 107
<210> 640
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 640
uacuggcgcu uuaucucauu acuuugagag ccaucaccag cgacuucggu cguaugggua 60
aagcgcuuau guaucggcuu cggccgauac auaagaagca ucaaag 106
<210> 641
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 641
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuucgg ucguaugggu 60
aaagcgcuua uguaucggcu ucggccgaua cauaagaagc aucaaag 107
<210> 642
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 642
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggug 60
aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 643
<211> 64
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 643
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuucgg ucguaugggu 60
aaag 64
<210> 644
<211> 62
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 644
gaugggcuuu uaucucauua cuuugagagc caucaccagc gacuucgguc guauggguaa 60
ag 62
<210> 645
<211> 105
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 645
gaugggcuuu uaucucauua cuuugagagc caucaccagc gacuucgguc guauggguaa 60
agcgcuuauu uaucggcuuc ggccgauaaa uaagaagcau caaag 105
<210> 646
<211> 156
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 646
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuaca cugggaucgc ugaauuagag aucggcgucc uuucauucua uauacuuugg 120
aguuuuaaaa ugucucuaag uacagaagca ucaaag 156
<210> 647
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 647
ggcgcuuuua ucucauuacu uugagagcca ucaccagcga cuucggucgu auggguaaag 60
cgcuuauuua ucggcuucgg ccgauaaaua agaagcauca aag 103
<210> 648
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 648
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuucggu cguaugggua 60
aagcgcuuau uuaucggcuu cggccgauaa auaagaagca ucaaag 106
<210> 649
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 649
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuucgg ucguaugggu 60
aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 650
<211> 112
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 650
uacuggcgcu uuuaucucau uacuuugaga gccaugcucc accagcgacu augucguaug 60
gguaaagcgc uuauuuaucg gagagaaauc cgauaaauaa gaagcaucaa ag 112
<210> 651
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 651
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgggguu aggguuaggg uuagggaagc aucaaag 97
<210> 652
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 652
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcggaggg agggagggag agggaaagca ucaaag 96
<210> 653
<211> 101
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 653
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcguuggg uuaggguuag gguuagggaa aagcaucaaa g 101
<210> 654
<211> 91
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 654
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaggg cuucggccgg aagcaucaaa g 91
<210> 655
<211> 103
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 655
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgccugc ucaguacgag aggaaccgca ggaagcauca aag 103
<210> 656
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 656
uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcccuc uucggaggga agcaucaaag 90
<210> 657
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 657
uacuggcgcc uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuac ggacuucggu ccguaagaag caucaaag 98
<210> 658
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 658
uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcggac gaccucucgg ucguccgaag caucaaag 98
<210> 659
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 659
uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108
<210> 660
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 660
uacuggcgcc uuuaucugca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99
<210> 661
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 661
gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 662
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 662
uacuggcgcc uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108
<210> 663
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 663
uacuggcgcc uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcggac gaccucucgg ucguccgaag caucaaag 98
<210> 664
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 664
uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcccuc uucggaggga agcaucaaag 90
<210> 665
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 665
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuac ggacuucggu ccguaagaag caucaaag 98
<210> 666
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 666
uacuggcgcc uuuaucauca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99
<210> 667
<211> 194
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 667
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg ccggcauggu 120
cccagccucc ucgcuggcgc cggcugggca acauuccgag gggaccgucc ccucgguaau 180
ggcgaauggg accc 194
<210> 668
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 668
uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcaggu gggacgaccu cucggucguc cuaucugaag caucaaag 108
<210> 669
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 669
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga aauccgauaa auaagaagca ucaaag 106
<210> 670
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 670
uacuggcgcc uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcggac gaccucucgg ucguccgaag caucaaag 98
<210> 671
<211> 92
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 671
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgccgga cuucgguccg gaagcaucaa ag 92
<210> 672
<211> 108
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 672
uacuggcgcu uuuaucggau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 108
<210> 673
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 673
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcggac gaccucucgg ucguccgaag caucaaag 98
<210> 674
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 674
gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcccucu ucggagggaa gcaucaaag 89
<210> 675
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 675
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcucccucu ucggagggag caucaaag 88
<210> 676
<211> 197
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 676
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg gucggcaugg 120
caucuccacc uccucgcggu ccgaccuggg cauccgaagg aggacgcacg uccacucgga 180
uggcuaaggg agagcca 197
<210> 677
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 677
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcccucu ucggagggcg caucaaag 88
<210> 678
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 678
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaguu uuggccggca 120
uggucccagc cuccucgcug gcgccggcug ggcaacaugc uucggcaugg cgaaugggac 180
cccggg 186
<210> 679
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 679
gauggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 680
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 680
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcccucu ucggagggaa gcaucaaag 89
<210> 681
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 681
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcucuuacg gacuucgguc cguaagagca ucaaag 96
<210> 682
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 682
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcucggacg accucucggu cguccgagca ucaaag 96
<210> 683
<211> 160
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 683
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcc ugucaccgga 120
ugugcuuucc ggucugauga guccgugagg acgaaacagg 160
<210> 684
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 684
gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcggacg accucucggu cguccgaagc aucaaag 97
<210> 685
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 685
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcggacg accucucggu cguccgaagc aucaaag 97
<210> 686
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 686
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcucaggug ggacgaccuc ucggucgucc uaucugagca ucaaag 106
<210> 687
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 687
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagga uggccggcau 120
ggucccagcc uccucgcugg cgccggcugg gcaacaccuu cggguggcga augggac 177
<210> 688
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 688
gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107
<210> 689
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 689
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguacugggu 60
aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 690
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 690
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucgugag aaauccgaua aauaagaagc aucaaag 107
<210> 691
<211> 109
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 691
guacuggcgc uuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua uuuaucggag agaaauccga uaaauaagaa gcaucaaag 109
<210> 692
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 692
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcggacg accucucggu cguccgaagc aucaaag 97
<210> 693
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 693
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 694
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 694
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuauu uaucggagag aaauccgaua aauaagaagc aucaaag 107
<210> 695
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 695
gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 696
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 696
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcccucu ucggagggaa gcaucaaag 89
<210> 697
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 697
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107
<210> 698
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 698
gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107
<210> 699
<211> 107
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 699
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcaggug ggacgaccuc ucggucgucc uaucugaagc aucaaag 107
<210> 700
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 700
uacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuac ggacuucggu ccguaagaag caucaaag 98
<210> 701
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 701
gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcccucu ucggagggaa gcaucaaag 89
<210> 702
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 702
gcuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 703
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 703
gcuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcggacg accucucggu cguccgaagc aucaaag 97
<210> 704
<211> 177
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 704
gauggccggc auggucccag ccuccucgcu ggcgccggcu gggcaacacc uucggguggc 60
gaaugggacu acuggcgcuu uuaucucauu acuuugagag ccaucaccag cgacuauguc 120
guauggguaa agcgcuuauu uaucggagag aaauccgaua aauaagaagc aucaaag 177
<210> 705
<211> 194
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 705
ggccggcaug gucccagccu ccucgcuggc gccggcuggg caacauuccg aggggaccgu 60
ccccucggua auggcgaaug ggacccuacu ggcgcuuuua ucucauuacu uugagagcca 120
ucaccagcga cuaugucgua uggguaaagc gcuuauuuau cggagagaaa uccgauaaau 180
aagaagcauc aaag 194
<210> 706
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 706
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagcgca ucaaag 96
<210> 707
<211> 172
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 707
cgugguuagg gccacguuaa auaguugcuu aagcccuaag cguugaucuu cggaucaggu 60
gcaauacugg cgcuuuuauc ucauuacuuu gagagccauc accagcgacu augucguaug 120
gguaaagcgc uuauuuaucg gagagaaauc cgauaaauaa gaagcaucaa ag 172
<210> 708
<211> 197
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 708
gggucggcau ggcaucucca ccuccucgcg guccgaccug ggcauccgaa ggaggacgca 60
cguccacucg gauggcuaag ggagagccau acuggcgcuu uuaucucauu acuuugagag 120
ccaucaccag cgacuauguc guauggguaa agcgcuuauu uaucggagag aaauccgaua 180
aauaagaagc aucaaag 197
<210> 709
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 709
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcc aguacugaug 120
aguccgugag gacgaaacga guaagcucgu cuacuggcgc uuuuaucuca u 171
<210> 710
<211> 99
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 710
uacuggcgcc uuuaucucau uacuuuagag agccaucacc agcgacuaug ucguaugggu 60
aaagcgcuua cggacuucgg uccguaagaa gcaucaaag 99
<210> 711
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 711
cgacuacuga ugaguccgug aggacgaaac gaguaagcuc gucuagucgu acuggcgcuu 60
uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa agcgcuuauu 120
uaucggagag aaauccgaua aauaagaagc aucaaag 157
<210> 712
<211> 106
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 712
gcuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcaggug ggacgaccuc ucggucgucc uaucugcgca ucaaag 106
<210> 713
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 713
uacuggcgcc uuuaucucau uacuuuagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 714
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 714
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagca uuccucagaa 120
aaugacaaac cuguggggcg uaaguagauc uucggaucua ugaucgugca gacguuaaaa 180
ucaggu 186
<210> 715
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 715
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcg acuacugaug 120
aguccgugag gacgaaacga guaagcucgu cuagucgcgu guagcgaagc a 171
<210> 716
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 716
cauuccucag aaaaugacaa accugugggg cguaaguaga ucuucggauc uaugaucgug 60
cagacguuaa aaucagguua cuggcgcuuu uaucucauua cuuugagagc caucaccagc 120
gacuaugucg uauggguaaa gcgcuuauuu aucggagaga aauccgauaa auaagaagca 180
ucaaag 186
<210> 717
<211> 186
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 717
uuuuggccgg caugguccca gccuccucgc uggcgccggc ugggcaacau gcuucggcau 60
ggcgaauggg accccgggua cuggcgcuuu uaucucauua cuuugagagc caucaccagc 120
gacuaugucg uauggguaaa gcgcuuauuu aucggagaga aauccgauaa auaagaagca 180
ucaaag 186
<210> 718
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 718
cgacuacuga ugaguccgug aggacgaaac gaguaagcuc gucuagucgc guguagcgaa 60
gcauacuggc gcuuuuaucu cauuacuuug agagccauca ccagcgacua ugucguaugg 120
guaaagcgcu uauuuaucgg agagaaaucc gauaaauaag aagcaucaaa g 171
<210> 719
<211> 168
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 719
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg gagccccgcu 120
gaugaggucg gggagaccga aagggacuuc ggucccuacg gggcuccc 168
<210> 720
<211> 144
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 720
ccacccccac caccaccccc acccccacca ccacccuacu ggcgcuuuua ucucauuacu 60
uugagagcca ucaccagcga cuaugucgua uggguaaagc gcuuauuuau cggagagaaa 120
uccgauaaau aagaagcauc aaag 144
<210> 721
<211> 157
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 721
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcg acuacugaug 120
aguccgugag gacgaaacga guaagcucgu cuagucg 157
<210> 722
<211> 172
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 722
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagcg ugguuagggc 120
cacguuaaau aguugcuuaa gcccuaagcg uugaucuucg gaucaggugc aa 172
<210> 723
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 723
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaaggg caauaaagcg 120
guuacaagcc cgcaaaaaua gcagaguaau gucgcgauag cgcggcauua augcagcuuu 180
auug 184
<210> 724
<211> 122
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 724
uacuggcgcu uuuaucucau uacuauuauc ucauuacuuu gagagccauc accagcgacu 60
augucguaug gguaaagcgc uuauuuaucg gagagaaauc cgauaaauaa gaagcaucaa 120
ag 122
<210> 725
<211> 184
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 725
ggcaauaaag cgguuacaag cccgcaaaaa uagcagagua augucgcgau agcgcggcau 60
uaaugcagcu uuauuguacu ggcgcuuuua ucucauuacu uugagagcca ucaccagcga 120
cuaugucgua uggguaaagc gcuuauuuau cggagagaaa uccgauaaau aagaagcauc 180
aaag 184
<210> 726
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 726
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaagac ccgcaaggcc 120
gacggcaucc gccgccgcug gugcaagucc agccgccccu ucgggggcgg gcgcucaugg 180
guaac 185
<210> 727
<211> 63
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 727
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aag 63
<210> 728
<211> 168
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 728
gggagccccg cugaugaggu cggggagacc gaaagggacu ucggucccua cggggcuccc 60
uacuggcgcu uuuaucucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 120
aagcgcuuau uuaucggaga gaaauccgau aaauaagaag caucaaag 168
<210> 729
<211> 171
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 729
ccaguacuga ugaguccgug aggacgaaac gaguaagcuc gucuacuggc gcuuuuaucu 60
cauuacuggc gcuuuuaucu cauuacuuug agagccauca ccagcgacua ugucguaugg 120
guaaagcgcu uauuuaucgg agagaaaucc gauaaauaag aagcaucaaa g 171
<210> 730
<211> 185
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 730
acccgcaagg ccgacggcau ccgccgccgc uggugcaagu ccagccgccc cuucgggggc 60
gggcgcucau ggguaacuac uggcgcuuuu aucucauuac uuugagagcc aucaccagcg 120
acuaugucgu auggguaaag cgcuuauuua ucggagagaa auccgauaaa uaagaagcau 180
caaag 185
<210> 731
<211> 160
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 731
ccugucaccg gaugugcuuu ccggucugau gaguccguga ggacgaaaca gguacuggcg 60
cuuuuaucuc auuacuuuga gagccaucac cagcgacuau gucguauggg uaaagcgcuu 120
auuuaucgga gagaaauccg auaaauaaga agcaucaaag 160
<210> 732
<211> 100
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 732
guacuggcgc cuuuaucuca uuacuuugag agccaucacc agcgacuaug ucguaguggg 60
uaaagcgcuu acggacuucg guccguaaga agcaucaaag 100
<210> 733
<211> 91
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 733
guacuggcgc uuuuaucuga uuacuuugag agccaucacc agcgacuaug ucguaguggg 60
uaaagcuccc ucuucggagg gagcaucaaa g 91
<210> 734
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 734
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 735
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 735
acuggcgccu uuaucucauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 736
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 736
gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 737
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 737
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcucccucu ucggagggag caucaaag 88
<210> 738
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 738
acuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 739
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 739
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 740
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 740
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcgcuuac ggacuucggu ccguaagaag caucaaag 98
<210> 741
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 741
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 742
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 742
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauugggua 60
aagcgcuuac ggacuucggu ccguaagaag caucaaag 98
<210> 743
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 743
acuggcgccu uuaucaucau uacuuugaga gccaucacca gcgacuaugu cguaugggua 60
aagcgcuuac ggacuucggu ccguaagaag caucaaag 98
<210> 744
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 744
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcgcccuc uucggaggga agcaucaaag 90
<210> 745
<211> 96
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 745
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucacau gaggaucacc caugugagca ucaaag 96
<210> 746
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 746
acuggcacuu uuaccugauu acuuugagag ccaacaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 747
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 747
acuggcacuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 748
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 748
acuggcccuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 749
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 749
acuggcgcuu uuaccugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 750
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 750
acuggcgcuu uuaucugauu acuuugagag ccaacaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 751
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 751
acuggcaccu uuaccugauu acuuugagag ccaacaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 752
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 752
acuggcaccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 753
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 753
acuggccccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 754
<211> 97
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 754
acuggcgccu uuaucugauu acuuugagag ccaacaccag cgacuauguc guauggguaa 60
agcgcuuacg gacuucgguc cguaagaagc aucaaag 97
<210> 755
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 755
gcuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 756
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 756
gacuggcgcu uuuaucugau uacuuugaga gccaucacca gcgacuaugu cguagugggu 60
aaagcucccu cuucggaggg agcaucaaag 90
<210> 757
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 757
acuggcgccu uuaucugauu acuuuggaga gccaucacca gcgacuaugu cguagugggu 60
aaagcucccu cuucggaggg agcaucaaag 90
<210> 758
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 758
acuggcgcau uuaucugauu acuuugugag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 759
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 759
acuggcgccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 760
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 760
acuggcgcuu uuaucugauu acuuuggaga gccaucacca gcgacuaugu cguagugggu 60
aaagcucccu cuucggaggg agcaucaaag 90
<210> 761
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 761
acuggcgcau uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 762
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 762
acuggcgcuu uuaucugauu acuuugugag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 763
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 763
acuggcgcuu uuauucugau uacuuugaga gccaucacca gcgacuaugu cguagugggu 60
aaagcucccu cuucggaggg agcaucaaag 90
<210> 764
<211> 88
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 764
acggcgcuuu uaucugauua cuuugagagc caucaccagc gacuaugucg uaguggguaa 60
agcucccucu ucggagggag caucaaag 88
<210> 765
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 765
acuggcgcuu uuauaugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 766
<211> 90
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 766
acuggcgcuu uuaucuugau uacuuugaga gccaucacca gcgacuaugu cguagugggu 60
aaagcucccu cuucggaggg agcaucaaag 90
<210> 767
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 767
acuggcgcuu uuaucugauu acuuugagag ccagcaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 768
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 768
acuggcgcug uuaucugauu acuucgagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucgaag 89
<210> 769
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 769
acuggcgcuc uuaucugauu acuucgagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucgaag 89
<210> 770
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 770
acuggcgcuu guaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucagag 89
<210> 771
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 771
acuggcgcuu cuaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucagag 89
<210> 772
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 772
acuggcgcuu ugaucugauu accuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaagg 89
<210> 773
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 773
acuggcgcuu ucaucugauu accuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaagg 89
<210> 774
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 774
acuggcgcug uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 775
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 775
acuggcgcuu uuaucugauu acuuugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucgaag 89
<210> 776
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 776
acuggcgcuu uuaucugauu acuucgagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucaaag 89
<210> 777
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 777
acuggcacuu cuaucugauu acucugagag ccaucaccag cgacuauguc guauggguaa 60
agccgcuuac ggacuucggu ccguaagagg caucagag 98
<210> 778
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 778
acuggcacuu cuaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucagag 89
<210> 779
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 779
acuggcaccu uuaucugauu acuuugagag ccaucaccag cgacuauguc guauggguaa 60
agccgcuuac ggacuucggu ccguaagagg caucaaag 98
<210> 780
<211> 98
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 780
acuggcacuu guaucugauu acucugagag ccaucaccag cgacuauguc guauggguaa 60
agccgcuuac ggacuucggu ccguaagagg caucagag 98
<210> 781
<211> 89
<212> RNA
<213> Artificial Sequence
<220>
<223> gNA Variant Scaffold Sequence
<400> 781
acuggcacuu guaucugauu acucugagag ccaucaccag cgacuauguc guagugggua 60
aagcucccuc uucggaggga gcaucagag 89
<210> 782
<211> 747
<212> DNA
<213> Alpharetrovirus Rous sarcoma virus
<400> 782
cctgtggtta tcaagacaga gggccctgct tggacccctc tggaaccaaa gctgattaca 60
agactcgccg acaccgtgcg gaccaagggc ctgcggagcc ctatcaccat ggccgagatg 120
gaagctctga tgagcagccc actgctgccc cacgacgtga ccaacctgat gagagtgatc 180
ctgggccccg ccccttacgc cctgtggatg gacgcctggg gggtgcagct gcagaccgtg 240
attgccgccg ccaccagaga tcctagacac cctgctaacg gccaaggcag aggcgaaaga 300
accaaccttg acagactgaa aggcctggcc gatggaatgg tcggcaacag cgaaggccag 360
gccgccctgc tgagacctgg cgagctggtg gctatcacag ccagcgccct gcaggccttc 420
agagaagtgg cccgactggc tgagcccacg gacccttggg ccgacatcat gcagggccct 480
tctgagagct tcgtggactt cgccaataga ctgatcaagg ccgtcgaggg cagcgatctt 540
cctcctagcg cgagagcccc tgttatcatc gactgcttcc ggcagaaaag ccagcccgac 600
atccaacagc tgatcagagc cgccccttcc accctgacca caccaggcga gatcatcaag 660
tacgtgctgg atagacagaa gaccgcccct ctgaccgatc agggcatcgc cgctgccatg 720
tcctctgcca tccagcctct ggtgatg 747
<210> 783
<211> 4787
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-(-1)-X-PR plasmid sequence
<400> 783
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc caaagaagaa gcggaaggtc tctagacaag 1800
agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 1860
ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 1920
agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 1980
gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 2040
acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 2100
ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 2160
tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 2220
aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 2280
agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 2340
catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 2400
gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 2460
gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 2520
agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 2580
ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 2640
cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 2700
tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 2760
tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 2820
attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 2880
aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 2940
gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc ggcgacctgc 3000
tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 3060
agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 3120
ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 3180
ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 3240
tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 3300
tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 3360
gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 3420
tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 3480
agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 3540
tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 3600
gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 3660
acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 3720
aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac cggggcgaga 3780
atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 3840
actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 3900
ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 3960
acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 4020
tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 4080
gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 4140
tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 4200
agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 4260
gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 4320
agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga 4380
aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 4440
gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 4500
gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 4560
aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 4620
accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 4680
gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 4740
agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4787
<210> 784
<211> 4787
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-(-1)-X-PR plasmid sequence
<400> 784
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc caaagaagaa gcggaaggtc tctagacaag 1800
agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 1860
ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 1920
agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 1980
gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 2040
acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 2100
ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 2160
tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 2220
aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 2280
agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 2340
catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 2400
gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 2460
gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 2520
agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 2580
ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 2640
cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 2700
tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 2760
tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 2820
attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 2880
aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 2940
gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc ggcgacctgc 3000
tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 3060
agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 3120
ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 3180
ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 3240
tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 3300
tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 3360
gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 3420
tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 3480
agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 3540
tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 3600
gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 3660
acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 3720
aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac cggggcgaga 3780
atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 3840
actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 3900
ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 3960
acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 4020
tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 4080
gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 4140
tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 4200
agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 4260
gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 4320
agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga 4380
aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 4440
gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 4500
gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 4560
aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 4620
accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 4680
gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 4740
agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4787
<210> 785
<211> 4869
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X-PR plasmid sequence
<400> 785
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620
gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680
aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740
agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800
gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860
ttaaatttt 4869
<210> 786
<211> 4869
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X-PR plasmid sequence
<400> 786
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620
gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680
aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740
agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800
gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860
ttaaatttt 4869
<210> 787
<211> 4563
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 787
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tga 4563
<210> 788
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 788
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 789
<211> 4563
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 789
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tga 4563
<210> 790
<211> 4563
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 790
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tga 4563
<210> 791
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 791
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 792
<211> 4869
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X (no p1/p6)plasmid sequence
<400> 792
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620
gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680
aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740
agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800
gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860
ttaaatttt 4869
<210> 793
<211> 4338
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1-X plasmid sequence
<400> 793
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgct 4338
<210> 794
<211> 4395
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X-(-1)-PR plasmid sequence
<400> 794
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaaccgg tgccccaaag 1380
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380
gtccctgact acgct 4395
<210> 795
<211> 4814
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-(-1)-PR plasmid sequence
<400> 795
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 4380
ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 4440
ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 4500
ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 4560
taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 4620
aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 4680
aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 4740
tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 4800
gcactttaaa tttt 4814
<210> 796
<211> 4649
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-NC-(-1)-PR plasmid sequence
<400> 796
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 4200
tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 4260
ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 4320
ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 4380
tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 4440
atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 4500
ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 4560
aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 4620
tgactcagat tggctgcact ttaaatttt 4649
<210> 797
<211> 4151
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-(-1)-PR plasmid sequence
<400> 797
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct gggggacccg gccataaagc aagagttttg 3480
gctgaagcaa tgagccaagt aacaaatcca gctaccataa tgatacagaa aggcaatttt 3540
aggaaccaaa gaaagactgt taagtgtttc aattgtggca aagaagggca catagccaaa 3600
aattgcaggg cccctaggaa aaagggctgt tggaaatgtg gaaaggaagg acaccaaatg 3660
aaagattgta ctgagagaca ggctaatttt ttagggaaga tctggccttc ccacaaggga 3720
aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga agagagcttc 3780
aggtttgggg aagagacaac aactccctct cagaagcagg agccgataga caaggaactg 3840
tatcctttag cttccctcag atcactcttt ggcagcgacc cctcgtcaca ataaagatag 3900
gggggcaatt aaaggaagct ctattagata caggagcaga tgatacagta ttagaagaaa 3960
tgaatttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt tttatcaaag 4020
taagacagta tgatcagata ctcatagaaa tctgcggaca taaagctata ggtacagtat 4080
tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag attggctgca 4140
ctttaaattt t 4151
<210> 798
<211> 3926
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-PR plasmid sequence
<400> 798
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct agacaggcta attttttagg gaagatctgg 3480
ccttcccaca agggaaggcc agggaatttt cttcagagca gaccagagcc aacagcccca 3540
ccagaagaga gcttcaggtt tggggaagag acaacaactc cctctcagaa gcaggagccg 3600
atagacaagg aactgtatcc tttagcttcc ctcagatcac tctttggcag cgacccctcg 3660
tcacaataaa gatagggggg caattaaagg aagctctatt agatacagga gcagatgata 3720
cagtattaga agaaatgaat ttgccaggaa gatggaaacc aaaaatgata gggggaattg 3780
gaggttttat caaagtaaga cagtatgatc agatactcat agaaatctgc ggacataaag 3840
ctataggtac agtattagta ggacctacac ctgtcaacat aattggaaga aatctgttga 3900
ctcagattgg ctgcacttta aatttt 3926
<210> 799
<211> 3759
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-PR plasmid sequence
<400> 799
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct tcctttagct tccctcagat cactctttgg 3480
cagcgacccc tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca 3540
ggagcagatg atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg 3600
atagggggaa ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc 3660
tgcggacata aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga 3720
agaaatctgt tgactcagat tggctgcact ttaaatttt 3759
<210> 800
<211> 4482
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X plasmid sequence
<400> 800
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gcttccttta gcttccctca gatcactctt 4200
tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc tctattagat 4260
acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg gaaaccaaaa 4320
atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat actcatagaa 4380
atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt caacataatt 4440
ggaagaaatc tgttgactca gattggctgc actttaaatt tt 4482
<210> 801
<211> 3450
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X plasmid sequence
<400> 801
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct 3450
<210> 802
<211> 4173
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-X-(-1)-PR plasmid sequence
<400> 802
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gct 4173
<210> 803
<211> 7709
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-X-(-1)-PR plasmid sequence
<400> 803
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gctaacttta gccagaacta tccgattgtg 4200
cagaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 4260
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 4320
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 4380
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 4440
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 4500
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 4560
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 4620
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 4680
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 4740
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 4800
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 4860
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 4920
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 4980
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 5040
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 5100
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 5160
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 5220
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 5280
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 5340
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 5400
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 5460
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 5520
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 5580
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 5640
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 5700
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 5760
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 5820
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 5880
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 5940
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 6000
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 6060
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 6120
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 6180
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 6240
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 6300
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 6360
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 6420
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 6480
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 6540
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 6600
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 6660
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 6720
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 6780
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 6840
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 6900
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 6960
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 7020
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 7080
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 7140
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 7200
ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 7260
tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 7320
ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 7380
ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 7440
tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 7500
atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 7560
ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 7620
aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 7680
tgactcagat tggctgcact ttaaatttt 7709
<210> 804
<211> 7874
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X-X-(-1)-PR plasmid sequence
<400> 804
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgctaa ctttagccag aactatccga ttgtgcagac cggtgcccca 4380
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 4440
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 4500
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 4560
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 4620
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 4680
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 4740
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 4800
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 4860
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 4920
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 4980
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 5040
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 5100
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 5160
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 5220
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 5280
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 5340
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 5400
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 5460
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 5520
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 5580
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 5640
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 5700
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 5760
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 5820
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 5880
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 5940
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 6000
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 6060
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 6120
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 6180
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 6240
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 6300
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 6360
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 6420
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 6480
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 6540
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 6600
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 6660
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 6720
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 6780
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 6840
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 6900
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 6960
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 7020
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 7080
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 7140
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 7200
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 7260
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 7320
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 7380
gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 7440
ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 7500
ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 7560
ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 7620
taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 7680
aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 7740
aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 7800
tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 7860
gcactttaaa tttt 7874
<210> 805
<211> 4566
<212> DNA
<213> Artificial Sequence
<220>
<223> Gag-1%TCS-STx-HA plasmid sequence
<400> 805
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttgaga atgtttactt ccagagcggc accggtaccg gtgccccaaa gaagaagcgg 1560
aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1620
agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1680
acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1740
cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1800
aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1860
agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1920
gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1980
ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 2040
agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 2100
gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 2160
tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2220
ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2280
atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2340
ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2400
cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2460
gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2520
agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2580
agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2640
gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2700
gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2760
taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2820
gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2880
aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2940
ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 3000
tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 3060
attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 3120
ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3180
aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3240
tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3300
gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3360
atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3420
atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3480
ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3540
ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3600
ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3660
agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3720
ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3780
aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3840
aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3900
accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3960
ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 4020
accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 4080
accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 4140
aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4200
gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4260
aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4320
gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4380
agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4440
tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4500
gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4560
tacgct 4566
<210> 806
<211> 2064
<212> DNA
<213> Artificial Sequence
<220>
<223> Gag-PCS-HRV3c plasmid sequence
<400> 806
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aacctggaag ttctgttcca gggcccgaat acagagtttg ccttatcctt gctgcgtaaa 1560
aatattatga ccatcaccac cagcaaaggc gaatttaccg ggcttggcat tcacgatcgc 1620
gtctgtgtaa tacccacgca tgctcagcca ggcgatgacg ttctcgtcaa tgggcaaaaa 1680
atccgggtga aagataaata taaactggtt gatccggaaa acatcaacct ggagctgacg 1740
gtgctgactc ttgaccgtaa tgaaaaattc cgcgatattc gcggttttat cagcgaagat 1800
ctcgaaggcg tggacgcaac gctggtggtg cacagcaaca acttcactaa cactattctg 1860
gaagtggggc ctgttaccat ggcgggactg atcaatttat caagtacgcc aaccaaccgc 1920
atgattcgtt atgactacgc caccaaaacc ggtcagtgcg gcggcgtatt gtgcgcaaca 1980
ggtaaaattt ttggtattca tgtcggcggc aacggtcgtc agggcttctc ggcgcaactg 2040
aaaaaacagt acttcgttga aaag 2064
<210> 807
<211> 4557
<212> DNA
<213> Artificial Sequence
<220>
<223> Gag-TCS-STx-HA plasmid sequence
<400> 807
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttgaga atctttattt tcagggcacc ggtgccccaa agaagaagcg gaaggtctct 1560
agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1620
aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1680
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1740
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1800
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1860
gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1920
ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1980
aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 2040
gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 2100
gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 2160
cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 2220
tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2280
ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2340
aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 2400
accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2460
agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2520
gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4140
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557
<210> 808
<211> 2064
<212> DNA
<213> Artificial Sequence
<220>
<223> Gag-PCS-HRV3c plasmid sequence
<400> 808
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aacctggaag ttctgttcca gggcccgaat acagagtttg ccttatcctt gctgcgtaaa 1560
aatattatga ccatcaccac cagcaaaggc gaatttaccg ggcttggcat tcacgatcgc 1620
gtctgtgtaa tacccacgca tgctcagcca ggcgatgacg ttctcgtcaa tgggcaaaaa 1680
atccgggtga aagataaata taaactggtt gatccggaaa acatcaacct ggagctgacg 1740
gtgctgactc ttgaccgtaa tgaaaaattc cgcgatattc gcggttttat cagcgaagat 1800
ctcgaaggcg tggacgcaac gctggtggtg cacagcaaca acttcactaa cactattctg 1860
gaagtggggc ctgttaccat ggcgggactg atcaatttat caagtacgcc aaccaaccgc 1920
atgattcgtt atgactacgc caccaaaacc ggtcagtgcg gcggcgtatt gtgcgcaaca 1980
ggtaaaattt ttggtattca tgtcggcggc aacggtcgtc agggcttctc ggcgcaactg 2040
aaaaaacagt acttcgttga aaag 2064
<210> 809
<211> 4557
<212> DNA
<213> Artificial Sequence
<220>
<223> Gag-PCS-STx-HA plasmid sequence
<400> 809
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aacctggaag ttctgttcca ggggcccacc ggtgccccaa agaagaagcg gaaggtctct 1560
agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1620
aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1680
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1740
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1800
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1860
gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1920
ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1980
aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 2040
gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 2100
gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 2160
cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 2220
tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2280
ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2340
aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata tcccagcgtg 2400
accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2460
agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2520
gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2580
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2640
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2700
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2760
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2820
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2880
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2940
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3000
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3060
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3120
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3180
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3240
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3300
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3360
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3420
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3480
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3540
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3600
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3660
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3720
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3780
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3840
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3900
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3960
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4020
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4080
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4140
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4200
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4260
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4320
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4380
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4440
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4500
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4557
<210> 810
<211> 2064
<212> DNA
<213> Artificial Sequence
<220>
<223> Gag-PCS-HRV3c plasmid sequence
<400> 810
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aacctggaag ttctgttcca gggcccgaat acagagtttg ccttatcctt gctgcgtaaa 1560
aatattatga ccatcaccac cagcaaaggc gaatttaccg ggcttggcat tcacgatcgc 1620
gtctgtgtaa tacccacgca tgctcagcca ggcgatgacg ttctcgtcaa tgggcaaaaa 1680
atccgggtga aagataaata taaactggtt gatccggaaa acatcaacct ggagctgacg 1740
gtgctgactc ttgaccgtaa tgaaaaattc cgcgatattc gcggttttat cagcgaagat 1800
ctcgaaggcg tggacgcaac gctggtggtg cacagcaaca acttcactaa cactattctg 1860
gaagtggggc ctgttaccat ggcgggactg atcaatttat caagtacgcc aaccaaccgc 1920
atgattcgtt atgactacgc caccaaaacc ggtcagtgcg gcggcgtatt gtgcgcaaca 1980
ggtaaaattt ttggtattca tgtcggcggc aacggtcgtc agggcttctc ggcgcaactg 2040
aaaaaacagt acttcgttga aaag 2064
<210> 811
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 (VSV-G)plasmid sequence
<400> 811
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 812
<211> 1575
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP29 (Rabies) plasmid sequence
<400> 812
atggttcctc aggctctcct gtttgtaccc cttctggttt ttccattgtg ttttgggaaa 60
ttccctattt acacgatacc agacaagctt ggtccctgga gtccgattga catacatcac 120
ctcagctgcc caaacaattt ggtagtggag gacgaaggat gcaccaacct gtcagggttc 180
tcctacatgg aacttaaagt tggatacatc ttagccataa aagtgaacgg gttcacttgc 240
acaggcgttg tgacggaggc tgaaacctac actaacttcg ttggttatgt cacaaccacg 300
ttcaaaagaa agcatttccg cccaacacca gatgcatgta gagccgcgta caactggaag 360
atggccggtg accccagata tgaagagtct ctacacaatc cgtaccctga ctaccgctgg 420
cttcgaactg taaaaaccac caaggagtct ctcgttatca tatctccaag tgtggcagat 480
ttggacccat atgacagatc ccttcactcg agggtcttcc ctagcgggaa gtgctcagga 540
gtagcggtgt cttctaccta ctgctccact aaccacgatt acaccatttg gatgcccgag 600
aatccgagac tagggatgtc ttgtgacatt tttaccaata gtagagggaa gagagcatcc 660
aaagggagtg agacttgcgg ctttgtagat gaaagaggcc tatataagtc tttaaaagga 720
gcatgcaaac tcaagttatg tggagttcta ggacttagac ttatggatgg aacatgggtc 780
tcgatgcaaa catcaaatga aaccaaatgg tgccctcccg ataagttggt gaacctgcac 840
gactttcgct cagacgaaat tgagcacctt gttgtagagg agttggtcag gaagagagag 900
gagtgtctgg atgcactaga gtccatcatg acaaccaagt cagtgagttt cagacgtctc 960
agtcatttaa gaaaacttgt ccctgggttt ggaaaagcat ataccatatt caacaagacc 1020
ttgatggaag ccgatgctca ctacaagtca gtcagaactt ggaatgagat cctcccttca 1080
aaagggtgtt taagagttgg ggggaggtgt catcctcatg tgaacggggt gtttttcaat 1140
ggtataatat taggacctga cggcaatgtc ttaatcccag agatgcaatc atccctcctc 1200
cagcaacata tggagttgtt ggaatcctcg gttatccccc ttgtgcaccc cctggcagac 1260
ccgtctaccg ttttcaagga cggtgacgag gctgaggatt ttgttgaagt tcaccttccc 1320
gatgtgcaca atcaggtctc aggagttgac ttgggtctcc cgaactgggg gaagtatgta 1380
ttactgagtg caggggccct gactgccttg atgttgataa ttttcctgat gacatgttgt 1440
agaagagtca atcgatcaga acctacgcaa cacaatctca gagggacagg gagggaggtg 1500
tcagtcactc cccaaagcgg gaagatcata tcttcatggg aatcacacaa gagtgggggt 1560
gagaccagac tgtaa 1575
<210> 813
<211> 1611
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP60 (FUG E)plasmid sequence
<400> 813
atgttcatgc cttcttcttt ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt 60
ctcatcattt tggcaaagaa ttcgccctta ggaaagatgg ttccgcaggt tcttttgttt 120
gtactccttc tgggtttttc gttgtgtttc gggaagttcc ccatttacac gataccagac 180
gaacttggtc cctggagccc tattgacata caccatctca gctgtccaaa taacctggtt 240
gtggaggatg aaggatgtac caacctgtcc gagttctcct acatggaact caaagtggga 300
tacatctcag ccatcaaagt gaacgggttc acttgcacag gtgttgtgac agaggcagag 360
acctacacca actttgttgg ttatgtcaca accacattca agagaaagca tttccgcccc 420
accccagacg catgtagagc cgcgtataac tggaagatgg ccggtgaccc cagatatgaa 480
gagtccctac acaatccata ccccgactac cactggcttc gaactgtaag aaccaccaaa 540
gagtccctca ttatcatatc cccaagtgtg acagatttgg acccatatga caaatccctt 600
cactcaaggg tcttccctgg cggaaagtgc tcaggaataa cggtgtcctc tacctactgc 660
tcaactaacc atgattacac catttggatg cccgagaatc cgagaccaag gacaccttgt 720
gacattttta ccaatagcag agggaagaga gcatccaacg ggaacaagac ttgcggcttt 780
gtggatgaaa gaggcctgta taagtctcta aaaggagcat gcaggctcaa gttatgtgga 840
gttcttggac ttagacttat ggatggaaca tgggtcgcga tgcaaacatc agatgagacc 900
aaatggtgcc ctccagatca gttggtgaat ttgcacgact ttcgctcaga cgagatcgag 960
catctcgttg tggaggagtt agttaagaaa agagaggaat gtctggatgc attagagtcc 1020
atcatgacca ccaagtcagt aagtttcaga cgtctcagtc acctgagaaa acttgtccca 1080
gggtttggaa aagcatatac catattcaac aaaaccttga tggaggctga tgctcactac 1140
aagtcagtcc ggacctggaa tgagatcatc ccctcaaaag ggtgtttgaa agttggagga 1200
aggtgccatc ctcatgtgaa cggggtgttt ttcaatggta taatattagg gcctgacgac 1260
catgtcctaa tcccagagat gcaatcatcc ctcctccagc aacatatgga gttgttggaa 1320
tcttcagtta tccccctgat gcaccccctg gcagaccctt ctacagtttt caaagaaggt 1380
gatgaggctg aggattttgt tgaagttcac ctcgagaaaa atccaatcga gcttgtagaa 1440
ggttggttca gtagttggaa aagctctatt gcctcttttt tctttatcat agggttaatc 1500
attggactat tcttggttct ccgagttggt atccatcttt gcattaaatt aaagcacacc 1560
aagaaaagac agatttatac agacatagag atgaaccgac ttggaaagta a 1611
<210> 814
<211> 2721
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP14.1 (HSV-1 gB) plasmid sequence
<400> 814
gccaccatga ggcaaggtgc acctgccagg ggtcggagat ggtttgttgt atgggctctg 60
ctgggactga ctttgggcgt gctcgttgct tccgcagcac cctcttctcc aggaacacct 120
ggcgtggctg cagccacgca agctgctaat ggcgggccag ctaccccagc cccaccggca 180
ccaggagctc cacctactgg cgatcccaag ccaaagaaga ataagaagcc aaagccacct 240
aaaccccctc gaccagctgg tgataatgct acagtggctg caggtcatgc tacactcaga 300
gaacatctta gagatataaa agctgaaaat acagacgcta atttctatgt ctgtccccca 360
cctacaggtg caaccgttgt ccaatttgaa caacccagga gatgtcctac acgtccagaa 420
gggcagaatt ataccgaagg tatagccgtt gtgtttaaag aaaatattgc accatataaa 480
tttaaagcga cgatgtatta taaggatgtg acagtcagcc aagtatggtt tgggcatcga 540
tatagccaat tcatgggcat tttcgaagat agagcacctg taccgtttga agaagttata 600
gataaaataa atgcaaaagg cgtgtgccgt agcacagcga aatatgttcg gaataatttg 660
gaaacaacgg cattccatcg cgatgatcat gaaacagata tggaacttaa gcccgcaaat 720
gctgccacac gtacctctcg tgggtggcat actacagatc tgaaatataa tccatcacga 780
gtcgaagcat ttcatcgata tggaacaacc gtgaattgta ttgtggaaga agttgatgcc 840
agaagtgttt atccttatga tgaattcgtc ctcgcaacag gagatttcgt ttatatgtca 900
ccattctatg gatatcgtga aggtagtcat acagagcata cttcttatgc agcagatagg 960
tttaaacaag tggatggttt ctatgctcgg gatttgacta caaaagcaag agctacagcc 1020
cccacaactc gaaatcttct gaccactcct aaatttactg tagcgtggga ttgggtaccc 1080
aaacgaccat ccgtatgtac tatgacaaaa tggcaagaag tagatgaaat gcttcggtct 1140
gaatatggtg gaagctttag attttcaagt gatgcaatct ctactacatt tacaactaat 1200
ctcacagaat atcccctttc acgagtcgat ttgggagatt gtattggtaa agatgcgcgg 1260
gatgcaatgg atcggatatt tgctcgtaga tataatgcca cacatataaa agttggacaa 1320
ccacaatatt atctcgcaaa cggcgggttc ctcattgcct atcaaccgct cctttctaat 1380
actcttgccg aactctatgt ccgagagcat ctgagggaac aatcacgtaa accgccgaat 1440
ccaacacctc ctccgcctgg agcatccgcg aatgcctctg tcgaacgtat aaagacaacg 1500
tcttcaattg aatttgctag acttcaattc acctataatc atatccaaag gcacgttaat 1560
gacatgctgg gtagagtcgc aattgcttgg tgtgaattgc aaaaccatga acttacgttg 1620
tggaatgaag cacgtaaatt gaatccaaat gcaattgcta gcgcgacggt tggacgcaga 1680
gtttccgccc gaatgctggg agatgttatg gcagtttcta catgtgtccc cgtggctgcc 1740
gataatgtca tagtgcagaa ttcaatgaga atatctagcc gacctggtgc atgttattct 1800
agaccactcg tgagtttccg ctatgaggat caagggcccc tggttgaagg ccaactcgga 1860
gaaaataatg aattgcgctt gacaagggac gcaattgaac catgtacagt tggccatcgc 1920
cggtatttta catttggcgg cgggtatgtc tactttgagg aatatgccta tagtcatcaa 1980
ctttctcgtg ctgatattac aactgtgtca acatttattg atctgaatat tacgatgctt 2040
gaagaccacg aattcgtacc gttggaagtc tatacacgcc atgagataaa agattccggg 2100
cttttggatt ataccgaagt gcaacgacgg aatcaactcc atgatctccg attcgcggat 2160
attgataccg taattcatgc tgatgcaaat gctgctatgt ttgctggact tggggcattc 2220
tttgaaggaa tgggcgatct cggaagagca gttgggaaag tcgttatggg aatagttggt 2280
ggtgtcgtta gtgcggtttc aggtgtcagc agctttatga gcaatccatt cggcgccctc 2340
gcagttgggc tcctggtgct tgctgggctt gctgctgctt tctttgcttt ccggtatgtg 2400
atgaggcttc aatccaatcc aatgaaagca ctttatccct tgactactaa agaactgaag 2460
aatccgacta atcctgatgc ttcaggagaa ggggaagaag gcggggattt cgatgaagct 2520
aaactggcgg aagcacgtga aatgatccgt tatatggcat tggtcagcgc tatggaaaga 2580
accgagcata aagctaagaa gaaaggaact tctgcccttc tctctgctaa agttactgat 2640
atggtgatga gaaaacggcg taatacaaat tatactcagg taccgaataa ggatggcgat 2700
gcagatgaag atgatttgtt a 2721
<210> 815
<211> 1185
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP14.2 (HSV-1 gD) plasmid sequence
<400> 815
atgggggggg ctgccgccag gttgggggcc gtgattttgt ttgtcgtcat agtgggcctc 60
catggggtcc gcagcaaata tgccttggtg gatgcctctc tcaagatggc cgaccccaat 120
cgctttcgcg gcaaagacct tccggtcctg gaccagctga ccgaccctcc gggggtccgg 180
cgcgtgtacc acatccaggc gggcctaccg gacccgttcc agccccccag cctcccgatc 240
acggtttact acgccgtgtt ggagcgcgcc tgccgcagcg tgctcctaaa cgcaccgtcg 300
gaggcccccc agattgtccg cggggcctcc gaagacgtcc ggaaacaacc ctacaacctg 360
accatcgctt ggtttcggat gggaggcaac tgtgctatcc ccatcacggt catggagtac 420
accgaatgct cctacaacaa gtctctgggg gcctgtccca tccgaacgca gccccgctgg 480
aactactatg acagcttcag cgccgtcagc gaggataacc tggggttcct gatgcacgcc 540
cccgcgtttg agaccgccgg cacgtacctg cggctcgtga agataaacga ctggacggag 600
attacacagt ttatcctgga gcaccgagcc aagggctcct gtaagtacgc cctcccgctg 660
cgcatccccc cgtcagcctg cctctccccc caggcctacc agcagggggt gacggtggac 720
agcatcggga tgctgccccg cttcatcccc gagaaccagc gcaccgtcgc cgtatacagc 780
ttgaagatcg ccgggtggca cgggcccaag gccccataca cgagcaccct gctgcccccg 840
gagctgtccg agacccccaa cgccacgcag ccagaactcg ccccggaaga ccccgaggat 900
tcggccctct tggaggaccc cgtggggacg gtggcgccgc aaatcccacc aaactggcac 960
ataccgtcga tccaggacgc cgcgacgcct taccatcccc cggccacccc gaacaacatg 1020
ggcctgatcg ccggcgcggt gggcggcagt ctcctggcag ccctggtcat ttgcggaatt 1080
gtgtactgga tgcgccgcca cactcaaaaa gccccaaagc gcatacgcct cccccacatc 1140
cgggaagacg accagccgtc ctcgcaccag cccttgtttt actta 1185
<210> 816
<211> 2517
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP14.3 (HSV-1 gH) plasmid sequence
<400> 816
atgggaaacg gcttgtggtt tgttggtgtg ataatcctgg gagtagcctg gggccaagta 60
catgattgga cagaacaaac cgatccttgg ttcctggacg gacttgggat ggatcggatg 120
tattggcgag atacaaatac tggaagactc tggcttccta atacaccaga tcctcagaag 180
ccacccaggg gcttccttgc tccaccagat gagctcaatc ttacaacagc tagtctcccg 240
ctgctgagat ggtatgaaga acggttctgc ttcgtgctgg taacaaccgc tgaattccct 300
cgcgatccag gacaattgtt gtatattccc aaaacatatc ttctgggtcg accacccaat 360
gcctctctcc cagcacctac tacagtggaa ccaacagctc aacccccgcc gtccgtggct 420
cctctgaaag ggcttctgca taaccccgta gcatcagtct tgctccgcag tcgtgcgtgg 480
gtcacattca gcgctgtgcc cgatcctgaa gcactcactt ttcccagggg cgataatgtc 540
gccacagcat ctcatccttc tggaccacgc gacactccac cccctcgccc acctgtcggc 600
gctcgcaggc atcccacaac agaacttgat attactcatc ttcataatgc ctcaactaca 660
tggctggcta caagagggct tctgcggagc cccgggagat atgtctactt ttctccctct 720
gcttctacat ggccagttgg aatatggaca actggtgaac ttgtccttgg ttgtgacgca 780
gcacttgtca gggcccggta tggtcgcgag tttatgggac tggtcatctc aatgcatgat 840
tcaccgccag tcgaggtcat ggttgtgccg gccggtcaaa cactggaccg agtgggagat 900
cctgcagatg aaaatccacc tggcgccctg ccaggcccac ccggtggacc aaggtaccgc 960
gtgttcgtgc tcggttcact cacccgtgca gataatggta gcgccttgga tgcactgaga 1020
cgtgtcggtg ggtatcctga agaagggacc aattatgcac aatttctcag tagggcgtat 1080
gctgaattct ttagcggaga tgctggagct gaacaagggc cacggccacc cttgttttgg 1140
cggctcactg gactcctggc cacctctgga ttcgcatttg tcaatgctgc tcatgccaat 1200
ggggctgtat gtctgtctga tctcttgggg ttccttgctc atagtcgagc cctcgcaggc 1260
ctggctgctc ggggagctgc cggttgcgca gccgacagtg tcttcttcaa cgtttccgtg 1320
cttgacccga ctgcaagact tcaactggaa gcaagattgc aacatctcgt tgcagaaatc 1380
ttggaaaggg agcaatccct ggctctgcat gcactcggat accaactcgc atttgtactt 1440
gactcccctt ccgcctatga tgccgttgca ccttctgccg ctcacctgat tgatgcattg 1500
tacgcagaat tcctcggcgg aagggttctt actactccag tggtgcatag ggccttgttc 1560
tatgcttctg cggtattgag acaaccattt ctggccggag tgcctagcgc cgtccaaagg 1620
gagcgagcta ggagatcact cctgattgcc tctgcactct gcacatctga tgtagcagcc 1680
gccacaaatg ctgatctgag gactgccctc gctagagctg atcatcaaaa gacgcttttc 1740
tggctccccg atcatttcag tccttgtgca gcgtcactta gattcgacct tgatgaatca 1800
gtcttcatat tggatgcact cgcccaggca actagatctg aaacacctgt tgaggtgctc 1860
gctcaacaaa cacatggttt ggcttctaca ctcacaaggt gggcccatta taatgcattg 1920
attcgggctt ttgtgcccga agcgtcccac cgatgtggcg gacaatcagc aaatgtggaa 1980
cccaggatat tggtgcctat tacgcataat gcttcttatg tggttacgca tagcccattg 2040
ccacgcggca ttgggtataa actgacgggt gtggatgttc gcagacctct gtttctgact 2100
tatctgacag caacctgtga gggttctact cgcgacattg aaagcaaacg tctcgtaagg 2160
acgcagaatc aaagagattt gggtctggtt ggcgctgttt tcatgaggta tactcccgca 2220
ggcgaagtta tgagcgtcct gctcgtcgac accgataata cccaacaaca gattgcagcg 2280
ggccccacag aaggggctcc atcagtcttc tccagcgatg ttccttcaac cgcgctgctc 2340
ctgttcccga atggcacggt tatccacctg ttggcgttcg atacacaacc tgtcgcagcc 2400
atcgcaccgg gattcttggc tgcatccgcc ctcggggttg tgatgataac agcagctctc 2460
gcggggatac tgaaagtgct gcgcaccagc gtgcccttct tctggcgacg agagtta 2517
<210> 817
<211> 682
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP14.4 (HSV-1 gL) plasmid sequence
<400> 817
atggggattt tgggttgggt cgggcttatt gccgttgggg ttttgtgtgt gcgggggggc 60
ttgccttcaa ccgaatatgt tattcggagt cgggtggctc gagaggtggg ggatatatta 120
aaggtgcctt gtgtgccgct cccgtctgac gatcttgatt ggcgttacga gaccccctcg 180
gctataaact atgctttgat agacggtata tttttgcgtt atcactgtcc cggattggac 240
acggtcttgt gggataggca tgcccagaag gcatattggg ttaacccctt tttatttgtg 300
gcgggttttt tggaggactt gagttacccc gcgtttcctg ccaacaccca ggaaacagaa 360
acgcgcttgg ccctttataa agagatacgc caggcgctgg acagtcgcaa gcaggccgcc 420
agccacacac ctgtgaaggc tgggtgtgtg aactttgact attcgcgcac ccgccgctgt 480
gtagggcgac aggatttggg acctaccaac ggaacgtctg gacggacccc ggttctgccg 540
ccggacgatg aagcgggcct gcagccgaag cccctcacca cgccgccgcc catcatcgcc 600
acgtcggacc ccaccccgcg acgggacgcc gccacaaaaa gcagacgccg acgaccccac 660
tcccggcgcc tcttataaga tc 682
<210> 818
<211> 1698
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP8 (RD114) plasmid sequence
<400> 818
atgaaactcc caacaggaat ggtcatttta tgtagcctaa taatagttcg ggcagggttt 60
gacgaccccc gcaaggctat cgcattagta caaaaacaac atggtaaacc atgcgaatgc 120
agcggagggc aggtatccga ggccccaccg aactccatcc aacaggtaac ttgcccaggc 180
aagacggcct acttaatgac caaccaaaaa tggaaatgca gagtcactcc aaaaaatctc 240
acccctagcg ggggagaact ccagaactgc ccctgtaaca ctttccagga ctcgatgcac 300
agttcttgtt atactgaata ccggcaatgc agggcgaata ataagacata ctacacggcc 360
accttgctta aaatacggtc tgggagcctc aacgaggtac agatattaca aaaccccaat 420
cagctcctac agtccccttg taggggctct ataaatcagc ccgtttgctg gagtgccaca 480
gcccccatcc atatctccga tggtggagga cccctcgata ctaagagagt gtggacagtc 540
caaaaaaggc tagaacaaat tcataaggct atgcatcctg aacttcaata ccacccctta 600
gccctgccca aagtcagaga tgaccttagc cttgatgcac ggacttttga tatcctgaat 660
accactttta ggttactcca gatgtccaat tttagccttg cccaagattg ttggctctgt 720
ttaaaactag gtacccctac ccctcttgcg atacccactc cctctttaac ctactcccta 780
gcagactccc tagcgaatgc ctcctgtcag attatacctc ccctcttggt tcaaccgatg 840
cagttctcca actcgtcctg tttatcttcc cctttcatta acgatacgga acaaatagac 900
ttaggtgcag tcacctttac taactgcacc tctgtagcca atgtcagtag tcctttatgt 960
gccctaaacg ggtcagtctt cctctgtgga aataacatgg catacaccta tttaccccaa 1020
aactggacag gactttgcgt ccaagcctcc ctcctccccg acattgacat catcccgggg 1080
gatgagccag tccccattcc tgccattgat cattatatac atagacctaa acgagctgta 1140
cagttcatcc ctttactagc tggactggga atcaccgcag cattcaccac cggagctaca 1200
ggcctaggtg tctccgtcac ccagtataca aaattatccc atcagttaat atctgatgtc 1260
caagtcttat ccggtaccat acaagattta caagaccagg tagactcgtt agctgaagta 1320
gttctccaaa ataggagggg actggaccta ctaacggcag aacaaggagg aatttgttta 1380
gccttacaag aaaaatgctg tttttatgct aacaagtcag gaattgtgag aaacaaaata 1440
agaaccctac aagaagaatt acaaaaacgc agggaaagcc tggcatccaa ccctctctgg 1500
accgggctgc agggctttct tccgtacctc ctacctctcc tgggacccct actcaccctc 1560
ctactcatac taaccattgg gccatgcgtt ttcagtcgcc tcatggcctt cattaatgat 1620
agacttaatg ttgtacatgc catggtgctg gcccagcaat accaagcact caaagctgag 1680
gaagaagctc aggattta 1698
<210> 819
<211> 1743
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP23 (HCV) plasmid sequence
<400> 819
atgggttgct ctttttctat cttcttactt gcccttctgt cgtgccttac agtgccagcg 60
tctgcggtgg aagttaggaa cgtcagttct agctactatg ccaccaatga ttgctcgaac 120
agcagcatca cctggcaact caacaacgca gttctccacc ttcctggatg cgtcccatgt 180
gagaatgata acggcacctt gcactgctgg atacaagtaa caccaaatgt ggctgtgaaa 240
caccgcggcg cgctcactca taacctgcgg acgcacgtcg atatgatcgt aatggcagct 300
acggtctgtt cggccctgta tgtgggagac atgtgcgggg ccgtgatgat tgtgtcgcag 360
gctctcataa tatcgccaga acgccacaac ttcacccaag agtgcaactg ttccatctac 420
caaggtcata tcactggcca tcgcatggca tgggacatga tgctaaactg gtcaccaact 480
cttaccatga tccttgctta tgccgctcgt gttcccgagc tagtccttga agttgtcttt 540
ggtggtcatt ggggtgtggt atttggcttg gcctatttct ccatgcaggg agcgtgggcc 600
aaggtcattg ccatcctcct tcttgttgcg ggagtggacg cagagactca taccaccggc 660
tcagctgcgg gtcatgccgc aagggggttt gccaacctcc ttagtcctgg ttccaagcaa 720
aaaataagtt tgatcaatac caatggcagc tggcacataa accggaccgc ccttaattgt 780
aatgacagct tgcagacggg tttcctcgct tctttgtttt acgtcaacaa cttcaacagc 840
tctggctgcc ccgagcgcat gtcttcctgc cgtgggctgg acgatttccg catcgggtgg 900
ggaaccctgg aatacgagac caacgtcacc aacgaggagg acatgaggcc gtactgctgg 960
cattaccctc cgaagccttg cggcattatc tcggctagga cagtttgcgg gccggtctac 1020
tgtttcactc ctagccctgt tgttgtgggt actactgacg agcagggctt gcccacctat 1080
agctgggggg aaaatgagac cgatgtcttc ctgttaaata gcacaagacc cccgcaagga 1140
gcttggttcg gctgcacttg gatgaatggg actgggttta ctaagacatg cggtgcacca 1200
ccttgccgca ttaggaggga tttcaacagc accctcgatc tactgtgccc cacagactgc 1260
tttagaaagc acccggacac cacctatctc aagtgtggag cagggccttg gttaaccccc 1320
agatgcctgg tagactaccc ttatagattg tggcattatc cgtgcaccgt aaattttacc 1380
atctttaagg tgcggatgta tgtggggggg gtggagcatc gattgtcagc agcatgcaac 1440
ttcacgcgcg gggaccgctg cagattggag gacagagata ggggtcagca gagcccactg 1500
ctgcattcca ccactgagtg ggcggtatta ccatgctctt tctccgactt accggcactg 1560
tccactggtc tattgcacct ccatcaaaat atcgtggacg tgcagtatct ctatggactt 1620
actccggcta tcacaaaata catcgtgaag tgggagtggg tggttctcct ctttttgctg 1680
ttggcagacg ccagggtctg tgcgtgcctt tggatgctca tcatattggg ccaagccgaa 1740
gcg 1743
<210> 820
<211> 2028
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP41 (EBOV) plasmid sequence
<400> 820
atgggcgtta caggaatatt gcagttacct cgtgatcgat tcaagaggac atcattcttt 60
ctttgggtaa ttatcctttt ccaaagaaca ttttccatcc cacttggagt catccacaat 120
agcacattac aggttagtga tgtcgacaaa ctagtttgtc gtgacaaact gtcatccaca 180
aatcaattga gatcagttgg actgaatctc gaagggaatg gagtggcaac tgacgtgcca 240
tctgcaacta aaagatgggg cttcaggtcc ggtgtcccac caaaggtggt caattatgaa 300
gctggtgaat gggctgaaaa ctgctacaat cttgaaatca aaaaacctga cgggagtgag 360
tgtctaccag cagcgccaga cgggattcgg ggcttccccc ggtgccggta tgtgcacaaa 420
gtatcaggaa cgggaccgtg tgccggagac tttgccttcc ataaagaggg tgctttcttc 480
ctgtatgatc gacttgcttc cacagttatc taccgaggaa cgactttcgc tgaaggtgtc 540
gttgcatttc tgatactgcc ccaagctaag aaggacttct tcagctcaca ccccttgaga 600
gagccggtca atgcaacgga ggacccgtct agtggctact attctaccac aattagatat 660
caggctaccg gttttggaac caatgagaca gagtacttgt tcgaggttga caatttgacc 720
tacgtccaac ttgaatcaag attcacacca cagtttctgc tccagctgaa tgagacaata 780
tatacaagtg ggaaaaggag caataccacg ggaaaactaa tttggaaggt caaccccgaa 840
attgatacaa caatcgggga gtgggccttc tgggaaacta aaaaaaacct cactagaaaa 900
attcgcagtg aagagttgtc tttcacagtt gtatcaaacg gagccaaaaa catcagtggt 960
cagagtccgg cgcgaacttc ttccgaccca gggaccaaca caacaactga agaccacaaa 1020
atcatggctt cagaaaattc ctctgcaatg gttcaagtgc acagtcaagg aagggaagct 1080
gcagtgtcgc atctaacaac ccttgccaca atctccacga gtccccaatc cctcacaacc 1140
aaaccaggtc cggacaacag cacccataat acacccgtgt ataaacttga catctctgag 1200
gcaactcaag ttgaacaaca tcaccgcaga acagacaacg acagcacagc ctccgacact 1260
ccctctgcca cgaccgcagc cggaccccca aaagcagaga acaccaacac gagcaagagc 1320
actgacttcc tggaccccgc caccacaaca agtccccaaa accacagcga gaccgctggc 1380
aacaacaaca ctcatcacca agataccgga gaagagagtg ccagcagcgg gaagctaggc 1440
ttaattacca atactattgc tggagtcgca ggactgatca caggcgggag aagaactcga 1500
agagaagcaa ttgtcaatgc tcaacccaaa tgcaacccta atttacatta ctggactact 1560
caggatgaag gtgctgcaat cggactggcc tggataccat atttcgggcc agcagccgag 1620
ggaatttaca tagaggggct aatgcacaat caagatggtt taatctgtgg gttgagacag 1680
ctggccaacg agacgactca agctcttcaa ctgttcctga gagccacaac tgagctacgc 1740
accttttcaa tcctcaaccg taaggcaatt gatttcttgc tgcagcgatg gggcggcaca 1800
tgccacattc tgggaccgga ctgctgtatc gaaccacatg attggaccaa gaacataaca 1860
gacaaaattg atcagattat tcatgatttt gttgataaaa cccttccgga ccagggggac 1920
aatgacaatt ggtggacagg atggagacaa tggataccgg caggtattgg agttacaggc 1980
gttataattg cagttatcgc tttattctgt atatgcaaat ttgtcttt 2028
<210> 821
<211> 1569
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP30 (Mokola) plasmid sequence
<400> 821
atgaatatac cttgctttgt tgtgattctc agcttagcca ctacacattc tctgggagaa 60
ttccccttgt acacaattcc tgagaagata gagaaatgga ctcccataga catgatccat 120
ctgagttgcc ccaacaacct attatctgag gaagaaggtt gcaatgcaga gtcatccttt 180
acttactttg agctcaagag tggttaccta gctcatcaga aggttccagg gtttacctgt 240
accggggtcg tgaacgaggc agagacatat acaaacttcg tcgggtacgt caccacaacc 300
ttcaaaagga agcactttag gcctacagta gccgcctgtc gtgatgccta caactggaaa 360
gtgtcaggag accccaggta cgaagagtca ctccacactc cttatcctga cagcagttgg 420
ttgaggactg tgactacaac caaagaatca cttctcataa tatcgcccag catcgtggaa 480
atggatattt acggcaggac tctccattcc cccatgtttc cttcaggagt atgttccaac 540
gtatatccct ctgtcccatc ctgtgagact aatcatgatt acacattatg gctgcctgaa 600
gatcctagtt tgagtttggt ctgtgatatc tttacttcca gcaacggaaa gaaggccatg 660
aacgggtcac gcatctgcgg attcaaggat gaaaggggat tctacagatc tttaaagggc 720
gcttgcaagc tgacattgtg tggaagacct ggaattaggt tattcgacgg aacttgggtc 780
tcttttacaa agccggacgt gcacgtatgg tgcactccca accaattgat caatatacac 840
aatgacagac tagatgagat agaacacctg atcgtggaag acatcataaa gaaaagagaa 900
gagtgcttag acaccctgga aacaatactt atgtctcaat ctgttagctt tagaaggttg 960
agccatttcc gaaagttagt tccaggatat gggaaggcct acactatttt aaacggcagc 1020
ctgatggaaa caaatgtcta ctacaaaagg gtcgacaagt gggctgacat cttaccctct 1080
aagggatgtc tgaaagtcgg gcaacaatgc atggaacctg tcaaaggagt cctcttcaat 1140
gggattatca agggcccgga tggccaaatt ttgatccccg agatgcagtc agagcagcta 1200
aagcagcata tggacctgtt gaaggcggct gtgtttcctc tccgacaccc tttaatcagc 1260
cgggaggcag tctttaagaa agacggggat gccgatgatt ttgtggatct ccatatgcct 1320
gatgtccaca agtctgtgtc agatgtcgac ctgggtctgc ctcattgggg tttctggatg 1380
ttgatcgggg caacaatagt agcatttgtg gtcttggtat gtttactccg tgtatgttgt 1440
aagagagtga ggaggagaag atcaggacgt gcaactcagg agatccccct gagctttccc 1500
tctgcccctg ttcctcgagc caaagtggtg tcatcttggg agtcctataa agggcttcca 1560
ggtacatta 1569
<210> 822
<211> 9586
<212> DNA
<213> Artificial Sequence
<220>
<223> pMRG103 (Gag-CasX119-PR) plasmid sequence
<400> 822
gtcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt cactctcccc 420
atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 480
gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg 540
gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt 600
tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc 660
gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc gccgcccgcc 720
ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc 780
gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc tgcgtgaaag 840
ccttaaaggg ctccgggagg gccctttgtg cgggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gcccgcgctg cccggcggct gtgagcgctg 960
cgggcgcggc gcggggcttt gtgcgctccg cgtgtgcgcg aggggagcgc ggccgggggc 1020
ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg ggtgtgtgcg 1080
tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc cctgcacccc 1140
cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtgc ggggcgtggc 1200
gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg 1260
ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gccccggagc gccggcggct 1320
gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 1380
gacttccttt gtcccaaatc tggcggagcc gaaatctggg aggcgccgcc gcaccccctc 1440
tagcgggcgc gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt 1500
cgtgcgtcgc cgcgccgccg tccccttctc catctccagc ctcggggctg ccgcaggggg 1560
acggctgcct tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg 1620
gctctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1680
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attcgccacc atgggtgcga 1740
gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg ttaaggccag 1800
ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag ctagaacgat 1860
tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata ctgggacagc 1920
tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat acagtagcaa 1980
ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct ttagacaaga 2040
tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct gacacaggac 2100
acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg caaatggtac 2160
atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa gagaaggctt 2220
tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc ccacaagatt 2280
taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg ttaaaagaga 2340
ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca gggcctattg 2400
caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact agtacccttc 2460
aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa atctataaaa 2520
gatggataat cctgggatta aataaaatag taagaatgta tagccctacc agcattctgg 2580
acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc tataaaactc 2640
taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc ttgttggtcc 2700
aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga gcgacactag 2760
aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca agagttttgg 2820
ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa ggcaatttta 2880
ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac atagccaaaa 2940
attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga caccaaatga 3000
aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc cacaagggaa 3060
ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa gagagcttca 3120
ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac aaggaactgt 3180
atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa aactttagcc 3240
agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc tctagacaag 3300
agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 3360
ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 3420
agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 3480
gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 3540
acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 3600
ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 3660
tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 3720
aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 3780
agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 3840
catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 3900
gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 3960
gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 4020
agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 4080
ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 4140
cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 4200
tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 4260
tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 4320
attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 4380
aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 4440
gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagttc ggcgacctgc 4500
tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 4560
agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 4620
ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 4680
ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 4740
tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 4800
tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 4860
gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 4920
tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 4980
agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 5040
tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 5100
gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 5160
acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 5220
aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcatcgac cggggcgaga 5280
atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 5340
actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 5400
ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 5460
acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 5520
tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 5580
gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 5640
tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 5700
agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 5760
gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 5820
agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga 5880
aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 5940
gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 6000
gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 6060
aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 6120
accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 6180
gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 6240
agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttcc tttagcttcc 6300
ctcagatcac tctttggcag cgacccctcg tcacaataaa gatagggggg caattaaagg 6360
aagctctatt agatacagga gcagatgata cagtattaga agaaatgaat ttgccaggaa 6420
gatggaaacc aaaaatgata gggggaattg gaggttttat caaagtaaga cagtatgatc 6480
agatactcat agaaatctgc ggacataaag ctataggtac agtattagta ggacctacac 6540
ctgtcaacat aattggaaga aatctgttga ctcagattgg ctgcacttta aatttttgac 6600
tagcagatct ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc 6660
tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt 6720
gtctctcact cggaaggaca tatgggaggg caaatcattt aaaacatcag aatgagtatt 6780
tggtttagag tttggcaaca tatgcccata tgctggctgc catgaacaaa ggttggctat 6840
aaagaggtca tcagtatatg aaacagcccc ctgctgtcca ttccttattc catagaaaag 6900
ccttgacttg aggttagatt ttttttatat tttgttttgt gttatttttt tctttaacat 6960
ccctaaaatt ttccttacat gttttactag ccagattttt cctcctctcc tgactactcc 7020
cagtcatagc tgtccctctt ctcttatgaa gatccctcga cctgcagccc aagcttggcg 7080
taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 7140
atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 7200
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagcggatc 7260
cgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 7320
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 7380
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 7440
gcctaggctt ttgcaaaaag ctaacttgtt tattgcagct tataatggtt acaaataaag 7500
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 7560
gtccaaactc atcaatgtat cttatcatgt ctggatccgc tgcattaatg aatcggccaa 7620
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 7680
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 7740
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 7800
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 7860
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 7920
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 7980
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 8040
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 8100
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 8160
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 8220
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 8280
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 8340
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 8400
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 8460
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 8520
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 8580
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 8640
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 8700
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 8760
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 8820
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 8880
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 8940
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 9000
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 9060
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 9120
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 9180
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 9240
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 9300
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 9360
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 9420
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 9480
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 9540
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctg 9586
<210> 823
<211> 9586
<212> DNA
<213> Artificial Sequence
<220>
<223> pMRG103 (Gag-CasX438-PR) plasmid sequence
<400> 823
gtcgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60
gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120
ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180
ggactttcca ttgacgtcaa tgggtggact atttacggta aactgcccac ttggcagtac 240
atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300
cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360
tattagtcat cgctattacc atgggtcgag gtgagcccca cgttctgctt cactctcccc 420
atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 480
gcgatggggg cggggggggg gggggcgcgc gccaggcggg gcggggcggg gcgaggggcg 540
gggcggggcg aggcggagag gtgcggcggc agccaatcag agcggcgcgc tccgaaagtt 600
tccttttatg gcgaggcggc ggcggcggcg gccctataaa aagcgaagcg cgcggcgggc 660
gggagtcgct gcgttgcctt cgccccgtgc cccgctccgc gccgcctcgc gccgcccgcc 720
ccggctctga ctgaccgcgt tactcccaca ggtgagcggg cgggacggcc cttctcctcc 780
gggctgtaat tagcgcttgg tttaatgacg gctcgtttct tttctgtggc tgcgtgaaag 840
ccttaaaggg ctccgggagg gccctttgtg cgggggggag cggctcgggg ggtgcgtgcg 900
tgtgtgtgtg cgtggggagc gccgcgtgcg gcccgcgctg cccggcggct gtgagcgctg 960
cgggcgcggc gcggggcttt gtgcgctccg cgtgtgcgcg aggggagcgc ggccgggggc 1020
ggtgccccgc ggtgcggggg ggctgcgagg ggaacaaagg ctgcgtgcgg ggtgtgtgcg 1080
tgggggggtg agcagggggt gtgggcgcgg cggtcgggct gtaacccccc cctgcacccc 1140
cctccccgag ttgctgagca cggcccggct tcgggtgcgg ggctccgtgc ggggcgtggc 1200
gcggggctcg ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg 1260
ccgcctcggg ccggggaggg ctcgggggag gggcgcggcg gccccggagc gccggcggct 1320
gtcgaggcgc ggcgagccgc agccattgcc ttttatggta atcgtgcgag agggcgcagg 1380
gacttccttt gtcccaaatc tggcggagcc gaaatctggg aggcgccgcc gcaccccctc 1440
tagcgggcgc gggcgaagcg gtgcggcgcc ggcaggaagg aaatgggcgg ggagggcctt 1500
cgtgcgtcgc cgcgccgccg tccccttctc catctccagc ctcggggctg ccgcaggggg 1560
acggctgcct tcggggggga cggggcaggg cggggttcgg cttctggcgt gtgaccggcg 1620
gctctagagc ctctgctaac catgttcatg ccttcttctt tttcctacag ctcctgggca 1680
acgtgctggt tgttgtgctg tctcatcatt ttggcaaaga attcgccacc atgggtgcga 1740
gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg ttaaggccag 1800
ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag ctagaacgat 1860
tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata ctgggacagc 1920
tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat acagtagcaa 1980
ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct ttagacaaga 2040
tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct gacacaggac 2100
acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg caaatggtac 2160
atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa gagaaggctt 2220
tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc ccacaagatt 2280
taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg ttaaaagaga 2340
ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca gggcctattg 2400
caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact agtacccttc 2460
aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa atctataaaa 2520
gatggataat cctgggatta aataaaatag taagaatgta tagccctacc agcattctgg 2580
acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc tataaaactc 2640
taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc ttgttggtcc 2700
aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga gcgacactag 2760
aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca agagttttgg 2820
ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa ggcaatttta 2880
ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac atagccaaaa 2940
attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga caccaaatga 3000
aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc cacaagggaa 3060
ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa gagagcttca 3120
ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac aaggaactgt 3180
atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa aactttagcc 3240
agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc tctagacaag 3300
agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg 3360
ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag 3420
agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca 3480
gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc 3540
acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc 3600
ccgctcctaa gaacatcgac cagagaaagc tgatccccgt gaaggacggc aacgagagac 3660
tgacctctag cggctttgcc tgcagccagt gttgccagcc tctgtacgtg tacaagctgg 3720
aacaagtgaa cgacaagggc aagccccaca ccaactactt cggcagatgc aacgtgtccg 3780
agcacgagag gctgatcctg ctgtctcctc acaagcccga ggccaacgat gagctggtca 3840
catacagcct gggcaagttc ggacagagag ccctggactt ctacagcatc cacgtgacca 3900
gggagagcaa tcaccctgtg aagcccctgg aacagatcgg cggcaatagc tgtgcctctg 3960
gacctgtggg aaaagccctg agcgacgcct gtatgggagc cgtggcatcc ttcctgacca 4020
agtaccagga catcatcctg gaacaccaga aagtgatcaa gaagaacgag aaaagactgg 4080
ccaacctcaa ggatatcgcc agcgctaacg gcctggcctt tcctaagatc accctgcctc 4140
cacagcctca caccaaagag ggcatcgagg cctacaacaa cgtggtggcc cagatcgtga 4200
tttgggtcaa cctgaatctg tggcagaagc tgaagatcgg cagggacgaa gccaagccac 4260
tgcagagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg 4320
attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca 4380
aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga 4440
gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc 4500
tgaagcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg 4560
agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa 4620
ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct 4680
ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc 4740
tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca 4800
tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg 4860
gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt 4920
tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa 4980
agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta 5040
tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga 5100
gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca 5160
acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag 5220
aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga 5280
atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg 5340
actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga 5400
ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt 5460
acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc 5520
tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg 5580
gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc 5640
tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc 5700
agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca 5760
gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag 5820
agctgaaggt tgagggccag atcacctact acaacaggag gaagaggcag aacgtcgtga 5880
aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca 5940
gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca 6000
gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac 6060
aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt 6120
accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga 6180
gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga 6240
agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttcc tttagcttcc 6300
ctcagatcac tctttggcag cgacccctcg tcacaataaa gatagggggg caattaaagg 6360
aagctctatt agatacagga gcagatgata cagtattaga agaaatgaat ttgccaggaa 6420
gatggaaacc aaaaatgata gggggaattg gaggttttat caaagtaaga cagtatgatc 6480
agatactcat agaaatctgc ggacataaag ctataggtac agtattagta ggacctacac 6540
ctgtcaacat aattggaaga aatctgttga ctcagattgg ctgcacttta aatttttgac 6600
tagcagatct ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc 6660
tgacttctgg ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt 6720
gtctctcact cggaaggaca tatgggaggg caaatcattt aaaacatcag aatgagtatt 6780
tggtttagag tttggcaaca tatgcccata tgctggctgc catgaacaaa ggttggctat 6840
aaagaggtca tcagtatatg aaacagcccc ctgctgtcca ttccttattc catagaaaag 6900
ccttgacttg aggttagatt ttttttatat tttgttttgt gttatttttt tctttaacat 6960
ccctaaaatt ttccttacat gttttactag ccagattttt cctcctctcc tgactactcc 7020
cagtcatagc tgtccctctt ctcttatgaa gatccctcga cctgcagccc aagcttggcg 7080
taatcatggt catagctgtt tcctgtgtga aattgttatc cgctcacaat tccacacaac 7140
atacgagccg gaagcataaa gtgtaaagcc tggggtgcct aatgagtgag ctaactcaca 7200
ttaattgcgt tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagcggatc 7260
cgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 7320
ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 7380
aggccgaggc cgcctcggcc tctgagctat tccagaagta gtgaggaggc ttttttggag 7440
gcctaggctt ttgcaaaaag ctaacttgtt tattgcagct tataatggtt acaaataaag 7500
caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta gttgtggttt 7560
gtccaaactc atcaatgtat cttatcatgt ctggatccgc tgcattaatg aatcggccaa 7620
cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct cactgactcg 7680
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 7740
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 7800
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 7860
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 7920
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 7980
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca atgctcacgc 8040
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 8100
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 8160
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 8220
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 8280
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 8340
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 8400
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 8460
cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa aaggatcttc 8520
acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa 8580
acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta 8640
tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc 8700
ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat 8760
ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta 8820
tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag ttcgccagtt 8880
aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt 8940
ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 9000
ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc 9060
gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc 9120
gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg 9180
cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga 9240
actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta 9300
ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct 9360
tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag 9420
ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca atattattga 9480
agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat ttagaaaaat 9540
aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctg 9586
<210> 824
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer sequence
<400> 824
gtgtagtaca agagatagaa 20
<210> 825
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer sequence
<400> 825
ctgcattcta gttgtggttt 20
<210> 826
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer sequence
<400> 826
ggccgagatg tctcgctccg 20
<210> 827
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<223> spacer sequence
<400> 827
cgagacgtaa ttacgtctcg 20
<210> 828
<211> 109
<212> DNA
<213> Artificial Sequence
<220>
<223> sequence encoding gRNA
<400> 828
actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc gtagtgggta 60
aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggttt 109
<210> 829
<211> 109
<212> DNA
<213> Artificial Sequence
<220>
<223> sequence encoding gRNA
<400> 829
actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc gtagtgggta 60
aagctccctc ttcggaggga gcatcaaagc gagacgtaat tacgtctcg 109
<210> 830
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 glycoprotein
<400> 830
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 831
<211> 4560
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 831
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
<210> 832
<211> 4620
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-(-1)-POL plasmid sequence
<400> 832
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccagta aaattaaagc 1800
caggaatgga tggcccaaaa gttaaacaat ggccattgac agaagaaaaa ataaaagcat 1860
tagtagaaat ttgtacagaa atggaaaagg aaggaaaaat ttcaaaaatt gggcctgaaa 1920
atccatacaa tactccagta tttgccataa agaaaaaaga cagtactaaa tggagaaaat 1980
tagtagattt cagagaactt aataagagaa ctcaagattt ctgggaagtt caattaggaa 2040
taccacatcc tgcagggtta aaacagaaaa aatcagtaac agtactggat gtgggcgatg 2100
catatttttc agttccctta gataaagact tcaggaagta tactgcattt accataccta 2160
gtataaacaa tgagacacca gggattagat atcagtacaa tgtgcttcca cagggatgga 2220
aaggatcacc agcaatattc cagtgtagca tgacaaaaat cttagagcct tttagaaaac 2280
aaaatccaga catagtcatc tatcaataca tggatgattt gtatgtagga tctgacttag 2340
aaatagggca gcatagaaca aaaatagagg aactgagaca acatctgttg aggtggggat 2400
ttaccacacc agacaaaaaa catcagaaag aacctccatt cctttggatg ggttatgaac 2460
tccatcctga taaatggaca gtacagccta tagtgctgcc agaaaaggac agctggactg 2520
tcaatgacat acagaaatta gtgggaaaat tgaattgggc aagtcagatt tatgcaggga 2580
ttaaagtaag gcaattatgt aaacttctta ggggaaccaa agcactaaca gaagtagtac 2640
cactaacaga agaagcagag ctagaactgg cagaaaacag ggagattcta aaagaaccgg 2700
tacatggagt gtattatgac ccatcaaaag acttaatagc agaaatacag aagcaggggc 2760
aaggccaatg gacatatcaa atttatcaag agccatttaa aaatctgaaa acaggaaagt 2820
atgcaagaat gaagggtgcc cacactaatg atgtgaaaca attaacagag gcagtacaaa 2880
aaatagccac agaaagcata gtaatatggg gaaagactcc taaatttaaa ttacccatac 2940
aaaaggaaac atgggaagca tggtggacag agtattggca agccacctgg attcctgagt 3000
gggagtttgt caatacccct cccttagtga agttatggta ccagttagag aaagaaccca 3060
taataggagc agaaactttc tatgtagatg gggcagccaa tagggaaact aaattaggaa 3120
aagcaggata tgtaactgac agaggaagac aaaaagttgt ccccctaacg gacacaacaa 3180
atcagaagac tgagttacaa gcaattcatc tagctttgca ggattcggga ttagaagtaa 3240
acatagtgac agactcacaa tatgcattgg gaatcattca agcacaacca gataagagtg 3300
aatcagagtt agtcagtcaa ataatagagc agttaataaa aaaggaaaaa gtctacctgg 3360
catgggtacc agcacacaaa ggaattggag gaaatgaaca agtagataaa ttggtcagtg 3420
ctggaatcag gaaagtacta tttttagatg gaatagataa ggcccaagaa gaacatgaga 3480
aatatcacag taattggaga gcaatggcta gtgattttaa cctaccacct gtagtagcaa 3540
aagaaatagt agccagctgt gataaatgtc agctaaaagg ggaagccatg catggacaag 3600
tagactgtag cccaggaata tggcagctag attgtacaca tttagaagga aaagttatct 3660
tggtagcagt tcatgtagcc agtggatata tagaagcaga agtaattcca gcagagacag 3720
ggcaagaaac agcatacttc ctcttaaaat tagcaggaag atggccagta aaaacagtac 3780
atacagacaa tggcagcaat ttcaccagta ctacagttaa ggccgcctgt tggtgggcgg 3840
ggatcaagca ggaatttggc attccctaca atccccaaag tcaaggagta atagaatcta 3900
tgaataaaga attaaagaaa attataggac aggtaagaga tcaggctgaa catcttaaga 3960
cagcagtaca aatggcagta ttcatccaca attttaaaag aaaagggggg attggggggt 4020
acagtgcagg ggaaagaata gtagacataa tagcaacaga catacaaact aaagaattac 4080
aaaaacaaat tacaaaaatt caaaattttc gggtttatta cagggacagc agagatccag 4140
tttggaaagg accagcaaag ctcctctgga aaggtgaagg ggcagtagta atacaagata 4200
atagtgacat aaaagtagtg ccaagaagaa aagcaaagat catcagggat tatggaaaac 4260
agatggcagg tgatgattgt gtggcaagta gacaggatga ggattaacac atggaattct 4320
gcaacaactg ctgtttatcc atttcagaat tgggtgtcga catagcagaa taggcgttac 4380
tcgacagagg agagcaagaa atggagccag tagatcctag actagagccc tggaagcatc 4440
caggaagtca gcctaaaact gcttgtacca attgctattg taaaaagtgt tgctttcatt 4500
gccaagtttg tttcatgaca aaagccttag gcatctccta tggcaggaag aagcggagac 4560
agcgacgaag agctcatcag aacagtcaga ctcatcaagc ttctctatca aagcagtaag 4620
<210> 833
<211> 4805
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-(-1)-X-PR plasmid sequence
<400> 833
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800
aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860
gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920
cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980
ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040
agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100
gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160
acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220
tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280
gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340
actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400
acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460
gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520
tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580
gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640
ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700
tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760
gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820
gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880
agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940
ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000
accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060
tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120
agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180
tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240
gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300
ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360
tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420
aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480
acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540
acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600
tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660
tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720
tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780
gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840
cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900
gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960
gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020
acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080
atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140
ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200
tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260
ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320
ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380
agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440
tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500
agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560
agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620
gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680
ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740
tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800
acgct 4805
<210> 834
<211> 4869
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X-PR plasmid sequence
<400> 834
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
tcctttagct tccctcagat cactctttgg cagcgacccc tcgtcacaat aaagataggg 4620
gggcaattaa aggaagctct attagataca ggagcagatg atacagtatt agaagaaatg 4680
aatttgccag gaagatggaa accaaaaatg atagggggaa ttggaggttt tatcaaagta 4740
agacagtatg atcagatact catagaaatc tgcggacata aagctatagg tacagtatta 4800
gtaggaccta cacctgtcaa cataattgga agaaatctgt tgactcagat tggctgcact 4860
ttaaatttt 4869
<210> 835
<211> 4560
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 835
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
<210> 836
<211> 4560
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-X plasmid sequence
<400> 836
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
<210> 837
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 837
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 838
<211> 4338
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X (no p1/p6) plasmid sequence
<400> 838
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgct 4338
<210> 839
<211> 4395
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1-X plasmid sequence
<400> 839
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaaccgg tgccccaaag 1380
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380
gtccctgact acgct 4395
<210> 840
<211> 4814
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X-(-1)-PR plasmid sequence
<400> 840
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 4380
ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 4440
ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 4500
ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 4560
taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 4620
aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 4680
aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 4740
tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 4800
gcactttaaa tttt 4814
<210> 841
<211> 4649
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-(-1)-PR plasmid sequence
<400> 841
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 4200
tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 4260
ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 4320
ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 4380
tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 4440
atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 4500
ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 4560
aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 4620
tgactcagat tggctgcact ttaaatttt 4649
<210> 842
<211> 4151
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-NC-(-1)-PR
<400> 842
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct gggggacccg gccataaagc aagagttttg 3480
gctgaagcaa tgagccaagt aacaaatcca gctaccataa tgatacagaa aggcaatttt 3540
aggaaccaaa gaaagactgt taagtgtttc aattgtggca aagaagggca catagccaaa 3600
aattgcaggg cccctaggaa aaagggctgt tggaaatgtg gaaaggaagg acaccaaatg 3660
aaagattgta ctgagagaca ggctaatttt ttagggaaga tctggccttc ccacaaggga 3720
aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga agagagcttc 3780
aggtttgggg aagagacaac aactccctct cagaagcagg agccgataga caaggaactg 3840
tatcctttag cttccctcag atcactcttt ggcagcgacc cctcgtcaca ataaagatag 3900
gggggcaatt aaaggaagct ctattagata caggagcaga tgatacagta ttagaagaaa 3960
tgaatttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt tttatcaaag 4020
taagacagta tgatcagata ctcatagaaa tctgcggaca taaagctata ggtacagtat 4080
tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag attggctgca 4140
ctttaaattt t 4151
<210> 843
<211> 3926
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-(-1)-PR plasmid sequence
<400> 843
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct agacaggcta attttttagg gaagatctgg 3480
ccttcccaca agggaaggcc agggaatttt cttcagagca gaccagagcc aacagcccca 3540
ccagaagaga gcttcaggtt tggggaagag acaacaactc cctctcagaa gcaggagccg 3600
atagacaagg aactgtatcc tttagcttcc ctcagatcac tctttggcag cgacccctcg 3660
tcacaataaa gatagggggg caattaaagg aagctctatt agatacagga gcagatgata 3720
cagtattaga agaaatgaat ttgccaggaa gatggaaacc aaaaatgata gggggaattg 3780
gaggttttat caaagtaaga cagtatgatc agatactcat agaaatctgc ggacataaag 3840
ctataggtac agtattagta ggacctacac ctgtcaacat aattggaaga aatctgttga 3900
ctcagattgg ctgcacttta aatttt 3926
<210> 844
<211> 3759
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-PR plasmid sequence
<400> 844
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct tcctttagct tccctcagat cactctttgg 3480
cagcgacccc tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca 3540
ggagcagatg atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg 3600
atagggggaa ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc 3660
tgcggacata aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga 3720
agaaatctgt tgactcagat tggctgcact ttaaatttt 3759
<210> 845
<211> 4482
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-PR plasmid sequence
<400> 845
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gcttccttta gcttccctca gatcactctt 4200
tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc tctattagat 4260
acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg gaaaccaaaa 4320
atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat actcatagaa 4380
atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt caacataatt 4440
ggaagaaatc tgttgactca gattggctgc actttaaatt tt 4482
<210> 846
<211> 3450
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X plasmid sequence
<400> 846
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct 3450
<210> 847
<211> 4173
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X plasmid sequence
<400> 847
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gct 4173
<210> 848
<211> 4338
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X plasmid sequence
<400> 848
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgct 4338
<210> 849
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 849
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 850
<211> 4395
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1-X plasmid sequence
<400> 850
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaaccgg tgccccaaag 1380
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380
gtccctgact acgct 4395
<210> 851
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 851
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 852
<211> 4814
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X-(-1)-PR plasmid sequence
<400> 852
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaatttct tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4320
gatgtccctg actacgctag acaggctaat tttttaggga agatctggcc ttcccacaag 4380
ggaaggccag ggaattttct tcagagcaga ccagagccaa cagccccacc agaagagagc 4440
ttcaggtttg gggaagagac aacaactccc tctcagaagc aggagccgat agacaaggaa 4500
ctgtatcctt tagcttccct cagatcactc tttggcagcg acccctcgtc acaataaaga 4560
taggggggca attaaaggaa gctctattag atacaggagc agatgataca gtattagaag 4620
aaatgaattt gccaggaaga tggaaaccaa aaatgatagg gggaattgga ggttttatca 4680
aagtaagaca gtatgatcag atactcatag aaatctgcgg acataaagct ataggtacag 4740
tattagtagg acctacacct gtcaacataa ttggaagaaa tctgttgact cagattggct 4800
gcactttaaa tttt 4814
<210> 853
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 853
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 854
<211> 4649
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-(-1)-PR plasmid sequence
<400> 854
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gctagacagg ctaatttttt agggaagatc 4200
tggccttccc acaagggaag gccagggaat tttcttcaga gcagaccaga gccaacagcc 4260
ccaccagaag agagcttcag gtttggggaa gagacaacaa ctccctctca gaagcaggag 4320
ccgatagaca aggaactgta tcctttagct tccctcagat cactctttgg cagcgacccc 4380
tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca ggagcagatg 4440
atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg atagggggaa 4500
ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc tgcggacata 4560
aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga agaaatctgt 4620
tgactcagat tggctgcact ttaaatttt 4649
<210> 855
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 855
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 856
<211> 4151
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-NC-(-1)-PR plasmid sequence
<400> 856
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct gggggacccg gccataaagc aagagttttg 3480
gctgaagcaa tgagccaagt aacaaatcca gctaccataa tgatacagaa aggcaatttt 3540
aggaaccaaa gaaagactgt taagtgtttc aattgtggca aagaagggca catagccaaa 3600
aattgcaggg cccctaggaa aaagggctgt tggaaatgtg gaaaggaagg acaccaaatg 3660
aaagattgta ctgagagaca ggctaatttt ttagggaaga tctggccttc ccacaaggga 3720
aggccaggga attttcttca gagcagacca gagccaacag ccccaccaga agagagcttc 3780
aggtttgggg aagagacaac aactccctct cagaagcagg agccgataga caaggaactg 3840
tatcctttag cttccctcag atcactcttt ggcagcgacc cctcgtcaca ataaagatag 3900
gggggcaatt aaaggaagct ctattagata caggagcaga tgatacagta ttagaagaaa 3960
tgaatttgcc aggaagatgg aaaccaaaaa tgataggggg aattggaggt tttatcaaag 4020
taagacagta tgatcagata ctcatagaaa tctgcggaca taaagctata ggtacagtat 4080
tagtaggacc tacacctgtc aacataattg gaagaaatct gttgactcag attggctgca 4140
ctttaaattt t 4151
<210> 857
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 857
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 858
<211> 3926
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-(-1)-PR plasmid sequence
<400> 858
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct agacaggcta attttttagg gaagatctgg 3480
ccttcccaca agggaaggcc agggaatttt cttcagagca gaccagagcc aacagcccca 3540
ccagaagaga gcttcaggtt tggggaagag acaacaactc cctctcagaa gcaggagccg 3600
atagacaagg aactgtatcc tttagcttcc ctcagatcac tctttggcag cgacccctcg 3660
tcacaataaa gatagggggg caattaaagg aagctctatt agatacagga gcagatgata 3720
cagtattaga agaaatgaat ttgccaggaa gatggaaacc aaaaatgata gggggaattg 3780
gaggttttat caaagtaaga cagtatgatc agatactcat agaaatctgc ggacataaag 3840
ctataggtac agtattagta ggacctacac ctgtcaacat aattggaaga aatctgttga 3900
ctcagattgg ctgcacttta aatttt 3926
<210> 859
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 859
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 860
<211> 3759
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X-PR plasmid sequence
<400> 860
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct tcctttagct tccctcagat cactctttgg 3480
cagcgacccc tcgtcacaat aaagataggg gggcaattaa aggaagctct attagataca 3540
ggagcagatg atacagtatt agaagaaatg aatttgccag gaagatggaa accaaaaatg 3600
atagggggaa ttggaggttt tatcaaagta agacagtatg atcagatact catagaaatc 3660
tgcggacata aagctatagg tacagtatta gtaggaccta cacctgtcaa cataattgga 3720
agaaatctgt tgactcagat tggctgcact ttaaatttt 3759
<210> 861
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 861
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 862
<211> 4482
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-PR plasmid sequence
<400> 862
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gcttccttta gcttccctca gatcactctt 4200
tggcagcgac ccctcgtcac aataaagata ggggggcaat taaaggaagc tctattagat 4260
acaggagcag atgatacagt attagaagaa atgaatttgc caggaagatg gaaaccaaaa 4320
atgatagggg gaattggagg ttttatcaaa gtaagacagt atgatcagat actcatagaa 4380
atctgcggac ataaagctat aggtacagta ttagtaggac ctacacctgt caacataatt 4440
ggaagaaatc tgttgactca gattggctgc actttaaatt tt 4482
<210> 863
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 863
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 864
<211> 3450
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-X plasmid sequence
<400> 864
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
accggtgccc caaagaagaa gcggaaggtc tctagacaag agatcaagag aatcaacaag 480
atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac aggccccatg 540
aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga aaacctgaga 600
aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa cctgaacaag 660
ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg ggaagagttc 720
cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa gaagatcgac 780
cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc cggctttgcc 840
tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc cgagaaaggc 900
aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa gctgattctg 960
ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag cctgggcaag 1020
tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag cacacacccc 1080
gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt gggcaaagcc 1140
ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca ggacatcatc 1200
atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct gagggagctg 1260
gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc tcacacaaaa 1320
gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt caacctgaac 1380
ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag actgaagggc 1440
ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg ggacatggtc 1500
tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt ctggcagaac 1560
ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga agaggaccgg 1620
aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca cctggaaaag 1680
aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat cgacaagaag 1740
gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga ggacgcccaa 1800
tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat cgagggcctg 1860
aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa gtggtacggc 1920
gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga catcagcggc 1980
ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa gaaactgaac 2040
ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa gatcaaaccc 2100
gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg cgagatcgtg 2160
cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc tctggccttc 2220
ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga aaccggctct 2280
ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag aaccagacag 2340
gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct ggacagcagc 2400
aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc tgctgtgatc 2460
gccctgacag accctgaagg atgcccactg agcagattca aggactccct gggcaaccct 2520
acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat ccaggccaag 2580
aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag caaggccaag 2640
aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta cgccgtgaca 2700
caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca gggcaagaga 2760
acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc taaactggcc 2820
tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac ctccaagacc 2880
tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct ggaaaagctc 2940
aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa ggttgagggc 3000
cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct gagcgtggaa 3060
ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac aaagggcaga 3120
tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt gcaagagaag 3180
ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc cctgaacatt 3240
gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac caacaagacc 3300
accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta cagaaaaaag 3360
ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa ggtagccctc 3420
gagtacccat atgatgtccc tgactacgct 3450
<210> 865
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 865
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 866
<211> 4173
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X plasmid sequence
<400> 866
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gct 4173
<210> 867
<211> 1503
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6 plasmid sequence
<400> 867
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taa 1503
<210> 868
<211> 4356
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-P1/P6-X plasmid sequence
<400> 868
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgt ttttagggaa gatctggcct tcccacaagg gaaggccagg gaattttctt 1140
cagagcagac cagagccaac agccccacca gaagagagct tcaggtttgg ggaagagaca 1200
acaactccct ctcagaagca ggagccgata gacaaggaac tgtatccttt agcttccctc 1260
agatcactct ttggcagcga cccctcgtca caaaacttta gccagaacta tccgattgtg 1320
cagaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1380
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1440
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1500
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1560
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1620
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1680
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1740
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1800
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1860
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1920
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1980
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 2040
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 2100
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 2160
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2220
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2280
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2340
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2400
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2460
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2520
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2580
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2640
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2700
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2760
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2820
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2880
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2940
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 3000
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 3060
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 3120
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3180
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3240
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3300
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3360
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3420
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3480
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3540
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3600
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3660
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3720
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3780
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3840
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3900
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3960
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 4020
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 4080
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 4140
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4200
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4260
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4320
ctcgagtacc catatgatgt ccctgactac gcttga 4356
<210> 869
<211> 4677
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-P1/P6-P1/P6-X plasmid sequence
<400> 869
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggctttttag ggaagatctg gccttcccac aagggaaggc cagggaattt tcttcagagc 1200
agaccagagc caacagcccc accagaagag agcttcaggt ttggggaaga gacaacaact 1260
ccctctcaga agcaggagcc gatagacaag gaactgtatc ctttagcttc cctcagatca 1320
ctctttggca gcgacccctc gtcacaaaac tttagccaga actatccgat tgtgcagacc 1380
ggtgccccaa agaagaagcg gaaggtctct agatttttag ggaagatctg gccttcccac 1440
aagggaaggc cagggaattt tcttcagagc agaccagagc caacagcccc accagaagag 1500
agcttcaggt ttggggaaga gacaacaact ccctctcaga agcaggagcc gatagacaag 1560
gaactgtatc ctttagcttc cctcagatca ctctttggca gcgacccctc gtcacaaaac 1620
tttagccaga actatccgat tgtgcagacc ggtgccccaa agaagaagcg gaaggtctct 1680
agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1740
aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1800
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1860
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1920
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1980
gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 2040
ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 2100
aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 2160
gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 2220
gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 2280
cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 2340
tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2400
ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2460
aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 2520
accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2580
agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2640
gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2700
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2760
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2820
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2880
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2940
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 3000
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 3060
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 3120
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 3180
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 3240
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 3300
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3360
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3420
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3480
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3540
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3600
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3660
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3720
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3780
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3840
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3900
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3960
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 4020
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 4080
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 4140
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 4200
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 4260
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 4320
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4380
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4440
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4500
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4560
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4620
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgct 4677
<210> 870
<211> 4764
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-P1/P6-P1/P6-X plasmid sequence
<400> 870
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
tttttaggga agatctggcc ttcccacaag ggaaggccag ggaattttct tcagagcaga 1560
ccagagccaa cagccccacc agaagagagc ttcaggtttg gggaagagac aacaactccc 1620
tctcagaagc aggagccgat agacaaggaa ctgtatcctt tagcttccct cagatcactc 1680
tttggcagcg acccctcgtc acaaaacttt agccagaact atccgattgt gcagaccggt 1740
gccccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1800
aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1860
ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1920
cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1980
accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 2040
gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 2100
aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 2160
cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 2220
tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2280
cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2340
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2400
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2460
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2520
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2580
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2640
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2700
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2760
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2820
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2880
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2940
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 3000
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 3060
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 3120
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 3180
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3240
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3300
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3360
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3420
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3480
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3540
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3600
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3660
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3720
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3780
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3840
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3900
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3960
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 4020
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 4080
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 4140
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 4200
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4260
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4320
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4380
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4440
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4500
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4560
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4620
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4680
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4740
ccatatgatg tccctgacta cgct 4764
<210> 871
<211> 4398
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-X-P1/P6 plasmid sequence
<400> 871
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcatgcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaccggtg ccccaaagaa gaagcggaag gtctctagac aagagatcaa gagaatcaac 1200
aagatcagaa ggagactggt caaggacagc aacacaaaga aggccggcaa gacaggcccc 1260
atgaaaaccc tgctcgtcag agtgatgacc cctgacctga gagagcggct ggaaaacctg 1320
agaaagaagc ccgagaacat ccctcagcct atcagcaaca ccagcagggc caacctgaac 1380
aagctgctga ccgactacac cgagatgaag aaagccatcc tgcacgtgta ctgggaagag 1440
ttccagaaag accccgtggg cctgatgagc agagttgctc agcctgccag caagaagatc 1500
gaccagaaca agctgaagcc cgagatggac gagaagggca atctgaccac agccggcttt 1560
gcctgctctc agtgtggcca gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa 1620
ggcaaggcct acaccaacta cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt 1680
ctgctggccc agctgaaacc tgagaaggac tctgatgagg ccgtgaccta cagcctgggc 1740
aagtttggac agagagccct ggacttctac agcatccacg tgaccaaaga aagcacacac 1800
cccgtgaagc ccctggctca gatcgccggc aatagatacg cctctggacc tgtgggcaaa 1860
gccctgtccg atgcctgcat gggaacaatc gccagcttcc tgagcaagta ccaggacatc 1920
atcatcgagc accagaaggt ggtcaagggc aaccagaaga gactggaaag cctgagggag 1980
ctggccggca aagagaacct ggaatacccc agcgtgaccc tgcctcctca gcctcacaca 2040
aaagaaggcg tggacgccta caacgaagtg atcgccagag tgagaatgtg ggtcaacctg 2100
aacctgtggc agaagctgaa actgtccagg gacgacgcca agcctctgct gagactgaag 2160
ggcttcccta gcttccctct ggtggaaaga caggccaatg aagtggattg gtgggacatg 2220
gtctgcaacg tgaagaagct gatcaacgag aagaaagagg atggcaaggt tttctggcag 2280
aacctggccg gctacaagag acaagaagcc ctgaggcctt acctgagcag cgaagaggac 2340
cggaagaagg gcaagaagtt cgccagatac cagctgggcg acctgctgct gcacctggaa 2400
aagaagcacg gcgaggactg gggcaaagtg tacgatgagg cctgggagag aatcgacaag 2460
aaggtggaag gcctgagcaa gcacattaag ctggaagagg aaagaaggag cgaggacgcc 2520
caatctaaag ccgctctgac cgattggctg agagccaagg ccagctttgt gatcgagggc 2580
ctgaaagagg ccgacaagga cgagttctgc agatgcgagc tgaagctgca gaagtggtac 2640
ggcgatctga gaggcaagcc cttcgccatt gaggccgaga acagcatcct ggacatcagc 2700
ggcttcagca agcagtacaa ctgcgccttc atttggcaga aagacggcgt caagaaactg 2760
aacctgtacc tgatcatcaa ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa 2820
cccgaggcct tcgaggctaa cagattctac accgtgatca acaaaaagtc cggcgagatc 2880
gtgcccatgg aagtgaactt caacttcgac gaccccaacc tgattatcct gcctctggcc 2940
ttcggcaaga gacagggcag agagttcatc tggaacgatc tgctgagcct ggaaaccggc 3000
tctctgaagc tggccaatgg cagagtgatc gagaaaaccc tgtacaacag gagaaccaga 3060
caggacgagc ctgctctgtt tgtggccctg accttcgaga gaagagaggt gctggacagc 3120
agcaacatca agcccatgaa cctgatcggc gtggaccggg gcgagaatat ccctgctgtg 3180
atcgccctga cagaccctga aggatgccca ctgagcagat tcaaggactc cctgggcaac 3240
cctacacaca tcctgagaat cggcgagagc tacaaagaga agcagaggac aatccaggcc 3300
aagaaagagg tggaacagag aagagccggc ggatactcta ggaagtacgc cagcaaggcc 3360
aagaatctgg ccgacgacat ggtccgaaac accgccagag atctgctgta ctacgccgtg 3420
acacaggacg ccatgctgat cttcgagaat ctgagcagag gcttcggccg gcagggcaag 3480
agaaccttta tggccgagag gcagtacacc agaatggaag attggctcac agctaaactg 3540
gcctacgagg gactgagcaa gacctacctg tccaaaacac tggcccagta tacctccaag 3600
acctgcagca attgcggctt caccatcacc agcgccgact acgacagagt gctggaaaag 3660
ctcaagaaaa ccgccaccgg ctggatgacc accatcaacg gcaaagagct gaaggttgag 3720
ggccagatca cctactacaa caggtacaag aggcagaacg tcgtgaagga tctgagcgtg 3780
gaactggaca gactgagcga agagagcgtg aacaacgaca tcagcagctg gacaaagggc 3840
agatcaggcg aggctctgag cctgctgaag aagaggttta gccacagacc tgtgcaagag 3900
aagttcgtgt gcctgaactg cggcttcgag acacacgccg atgaacaggc tgccctgaac 3960
attgccagaa gctggctgtt cctgagaagc caagagtaca agaagtacca gaccaacaag 4020
accaccggca acaccgacaa gagggccttt gtggaaacct ggcagagctt ctacagaaaa 4080
aagctgaaag aagtctggaa gcccgccgtg actagtccaa aaaagaagag aaaggtagcc 4140
ctcgagtacc catatgatgt ccctgactac gctggcggtg gaagacaggc taatttttta 4200
gggaagatct ggccttccca caagggaagg ccagggaatt ttcttcagag cagaccagag 4260
ccaacagccc caccagaaga gagcttcagg tttggggaag agacaacaac tccctctcag 4320
aagcaggagc cgatagacaa ggaactgtat cctttagctt ccctcagatc actctttggc 4380
agcgacccct cgtcacaa 4398
<210> 872
<211> 4275
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-NC-X-P1/P6 plasmid sequence
<400> 872
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagac cggtgcccca 1320
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1380
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1440
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1500
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1560
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1620
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1680
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1740
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1800
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 1860
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 1920
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 1980
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2040
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2100
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2160
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2220
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2280
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2340
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2400
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2460
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2520
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2580
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2640
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2700
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2760
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 2820
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 2880
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 2940
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3000
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3060
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3120
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3180
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3240
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3300
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3360
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3420
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3480
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3540
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3600
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3660
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3720
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3780
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 3840
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 3900
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 3960
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4020
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4080
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4140
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4200
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4260
tggaagcccg ccgtg 4275
<210> 873
<211> 4560
<212> DNA
<213> Artificial Sequence
<220>
<223> MA-CA-P2-P1/P6-X plasmid sequence
<400> 873
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
aactttagcc agaactatcc gattgtgcag accggtgccc caaagaagaa gcggaaggtc 1560
tctagacaag agatcaagag aatcaacaag atcagaagga gactggtcaa ggacagcaac 1620
acaaagaagg ccggcaagac aggccccatg aaaaccctgc tcgtcagagt gatgacccct 1680
gacctgagag agcggctgga aaacctgaga aagaagcccg agaacatccc tcagcctatc 1740
agcaacacca gcagggccaa cctgaacaag ctgctgaccg actacaccga gatgaagaaa 1800
gccatcctgc acgtgtactg ggaagagttc cagaaagacc ccgtgggcct gatgagcaga 1860
gttgctcagc ctgccagcaa gaagatcgac cagaacaagc tgaagcccga gatggacgag 1920
aagggcaatc tgaccacagc cggctttgcc tgctctcagt gtggccagcc tctgttcgtg 1980
tacaagctgg aacaggtgtc cgagaaaggc aaggcctaca ccaactactt cggcagatgt 2040
aacgtggccg agcacgagaa gctgattctg ctggcccagc tgaaacctga gaaggactct 2100
gatgaggccg tgacctacag cctgggcaag tttggacaga gagccctgga cttctacagc 2160
atccacgtga ccaaagaaag cacacacccc gtgaagcccc tggctcagat cgccggcaat 2220
agatacgcct ctggacctgt gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc 2280
agcttcctga gcaagtacca ggacatcatc atcgagcacc agaaggtggt caagggcaac 2340
cagaagagac tggaaagcct gagggagctg gccggcaaag agaacctgga ataccccagc 2400
gtgaccctgc ctcctcagcc tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc 2460
gccagagtga gaatgtgggt caacctgaac ctgtggcaga agctgaaact gtccagggac 2520
gacgccaagc ctctgctgag actgaagggc ttccctagct tccctctggt ggaaagacag 2580
gccaatgaag tggattggtg ggacatggtc tgcaacgtga agaagctgat caacgagaag 2640
aaagaggatg gcaaggtttt ctggcagaac ctggccggct acaagagaca agaagccctg 2700
aggccttacc tgagcagcga agaggaccgg aagaagggca agaagttcgc cagataccag 2760
ctgggcgacc tgctgctgca cctggaaaag aagcacggcg aggactgggg caaagtgtac 2820
gatgaggcct gggagagaat cgacaagaag gtggaaggcc tgagcaagca cattaagctg 2880
gaagaggaaa gaaggagcga ggacgcccaa tctaaagccg ctctgaccga ttggctgaga 2940
gccaaggcca gctttgtgat cgagggcctg aaagaggccg acaaggacga gttctgcaga 3000
tgcgagctga agctgcagaa gtggtacggc gatctgagag gcaagccctt cgccattgag 3060
gccgagaaca gcatcctgga catcagcggc ttcagcaagc agtacaactg cgccttcatt 3120
tggcagaaag acggcgtcaa gaaactgaac ctgtacctga tcatcaatta cttcaaaggc 3180
ggcaagctgc ggttcaagaa gatcaaaccc gaggccttcg aggctaacag attctacacc 3240
gtgatcaaca aaaagtccgg cgagatcgtg cccatggaag tgaacttcaa cttcgacgac 3300
cccaacctga ttatcctgcc tctggccttc ggcaagagac agggcagaga gttcatctgg 3360
aacgatctgc tgagcctgga aaccggctct ctgaagctgg ccaatggcag agtgatcgag 3420
aaaaccctgt acaacaggag aaccagacag gacgagcctg ctctgtttgt ggccctgacc 3480
ttcgagagaa gagaggtgct ggacagcagc aacatcaagc ccatgaacct gatcggcgtg 3540
gaccggggcg agaatatccc tgctgtgatc gccctgacag accctgaagg atgcccactg 3600
agcagattca aggactccct gggcaaccct acacacatcc tgagaatcgg cgagagctac 3660
aaagagaagc agaggacaat ccaggccaag aaagaggtgg aacagagaag agccggcgga 3720
tactctagga agtacgccag caaggccaag aatctggccg acgacatggt ccgaaacacc 3780
gccagagatc tgctgtacta cgccgtgaca caggacgcca tgctgatctt cgagaatctg 3840
agcagaggct tcggccggca gggcaagaga acctttatgg ccgagaggca gtacaccaga 3900
atggaagatt ggctcacagc taaactggcc tacgagggac tgagcaagac ctacctgtcc 3960
aaaacactgg cccagtatac ctccaagacc tgcagcaatt gcggcttcac catcaccagc 4020
gccgactacg acagagtgct ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc 4080
atcaacggca aagagctgaa ggttgagggc cagatcacct actacaacag gtacaagagg 4140
cagaacgtcg tgaaggatct gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac 4200
aacgacatca gcagctggac aaagggcaga tcaggcgagg ctctgagcct gctgaagaag 4260
aggtttagcc acagacctgt gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca 4320
cacgccgatg aacaggctgc cctgaacatt gccagaagct ggctgttcct gagaagccaa 4380
gagtacaaga agtaccagac caacaagacc accggcaaca ccgacaagag ggcctttgtg 4440
gaaacctggc agagcttcta cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact 4500
agtccaaaaa agaagagaaa ggtagccctc gagtacccat atgatgtccc tgactacgct 4560
<210> 874
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 874
Ser Ala Val His Ser Val Arg Leu
1 5
<210> 875
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 875
Arg Thr Val Asn Thr Val Arg Val
1 5
<210> 876
<211> 11
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 876
Asn Thr Val His Thr Val Arg Gln Val Glu Ser
1 5 10
<210> 877
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 877
Ala Ala Val His Thr Val Lys Ala
1 5
<210> 878
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 878
Arg Thr Val Asn Thr Val Thr Thr
1 5
<210> 879
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 879
Arg Ser Val Asn Thr Val Thr Ala
1 5
<210> 880
<211> 2413
<212> DNA
<213> Artificial Sequence
<220>
<223> pStx42.174.12.7 plasmid sequence
<400> 880
gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120
atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180
attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240
gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300
agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360
aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420
cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480
cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540
actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600
cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660
ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720
ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780
gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840
gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900
ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960
cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020
caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080
taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800
ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860
gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920
agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980
aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040
tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100
gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280
acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340
gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400
tttttttgaa ttc 2413
<210> 881
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 plasmid sequence
<400> 881
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 882
<211> 5178
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP40 plasmid sequence
<400> 882
atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60
ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120
agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180
agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240
ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300
ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360
cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420
ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480
atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540
tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660
gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720
gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780
ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840
gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960
gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020
aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080
gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140
gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200
gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260
cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320
cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380
gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440
agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggt 1500
tctggcggca gagcccgggg cctgtgctac acctgcggat cccctggaca ctaccaggcc 1560
cagtgtccta agaaaagaaa gtctggtaac agcagagagc ggtgccagct gtgtgatggc 1620
atgggccaca acgccaaaca gtgccggaga cgggacggaa accaaggaca aagacccggc 1680
cggggactga gcagcggacc ttggcctgtc agccagcaac ctgccgtgtc cctggctatg 1740
accatggaac acaaggaccg gcctctggtg cgggtgatcc tgacaaatac cggctctcac 1800
cccgtgaagc agcggtcagt gtacatcaca gccctgctgg acagcggcgc tgatatcacc 1860
atcattagcg aggaggactg gcctaccgac tggcccgtga tggaagctgc caatccccag 1920
atccacggca tcggaggcgg aatcccgatg agaaagtcca gagacatgat cgaggtgggc 1980
gtgatcaacc gggacggctc tcttgagaga cctctgctgc tgttccccgc cgtggctatg 2040
gtgcgaggca gcatcctggg ccgcgactgc ctgcagggcc tgggcctgag actgaccaac 2100
ctgaacttta gccagggtgc caccagctgc taccactgcg gcaccggcgg cagcccaaag 2160
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 2220
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 2280
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 2340
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 2400
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 2460
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2520
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2580
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2640
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2700
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2760
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2820
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2880
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2940
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 3000
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 3060
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 3120
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 3180
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 3240
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 3300
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 3360
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 3420
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3480
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3540
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3600
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3660
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3720
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3780
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3840
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3900
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3960
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 4020
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 4080
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 4140
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 4200
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 4260
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 4320
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 4380
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 4440
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4500
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4560
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4620
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4680
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4740
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4800
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4860
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4920
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4980
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 5040
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 5100
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 5160
gtccctgact acgcttga 5178
<210> 883
<211> 5187
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP41 plasmid sequence
<400> 883
atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60
ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120
agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180
cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240
ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300
ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360
agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420
cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480
attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540
tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660
gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720
gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780
ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840
gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960
gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020
aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080
gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140
gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200
gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260
cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320
caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380
gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440
tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagacaggc 1500
tccggcggcc gggccagaga gctgtgctac acctgtggct ctccaggcca ctaccaggct 1560
cagtgtccta aaaagcggaa gtctggcaat tctagagagc ggtgccagct gtgcaacggc 1620
atgggccata atgccaaaca gtgtcggaaa cgggacggaa accagggcca gagaccaggc 1680
agaggcctgt cttctggccc ctggcccggc cctgagcctc ctgctgtgtc cctggctatg 1740
accatggaac acaaggacag acccctggtg cgggtgatcc tgacaaacac cggaagccac 1800
cccgtgaagc agcgctccgt gtacatcaca gcccttctgg acagcggcgc cgacatcacc 1860
atcatcagcg aggaagattg gcctacagac tggcctgtga tggaagccgc aaacccccag 1920
atccacggca tcggcggagg tatacccatg cggaagagca gagacatgat cgagctgggc 1980
gtgatcaacc gggacggcag cctggaacgg cccctgctgt tgtttcctgc tgtggctatg 2040
gtgcggggaa gcatcctggg cagagattgc ctgcagggcc tgggcctgcg cctgaccaac 2100
ctgtgaggag ggccactgtt ctcaggtgcc acatcttgtt accactgcgg caccggcggc 2160
agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 2220
aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 2280
ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 2340
cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 2400
accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 2460
gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 2520
aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 2580
cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 2640
tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2700
cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2760
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2820
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2880
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2940
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 3000
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 3060
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 3120
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 3180
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 3240
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 3300
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 3360
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 3420
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 3480
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 3540
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 3600
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3660
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3720
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3780
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3840
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3900
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3960
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 4020
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 4080
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 4140
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 4200
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 4260
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 4320
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 4380
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 4440
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 4500
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 4560
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 4620
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4680
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4740
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4800
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4860
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4920
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4980
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 5040
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 5100
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 5160
ccatatgatg tccctgacta cgcttga 5187
<210> 884
<211> 5684
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP42 plasmid sequence
<400> 884
atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60
agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120
tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180
cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240
ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300
aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360
gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420
ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480
tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540
ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600
aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660
gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720
agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780
gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840
atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900
ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960
ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020
aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080
gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140
agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200
cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260
aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320
gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380
tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440
gctctgcagg gcaaaagcat caaggaagtg cttttccagc agcaagctcg gaacaagcgg 1500
ggaagacaga gaagcggcaa tagcggttgt tttgtgtgcg gccagcccgg ccaccgcgcc 1560
gccgtgtgcc cccagaagca gcagagcccc gtgaacaccc ctaatctgtg cccgcgctgt 1620
aaaaaaggaa agcattgggc acgagattgc cggtccaaaa cagatgttca aggtacccct 1680
ttacccccgg tgtcgggaaa ctgggtgagg ggccagcccc tggccccgaa acaatgttat 1740
ggggcaacac tgcaggttcc aaaagaacca ttgcagacct ctgtcgagcc acaagaggca 1800
gcgcgggatt ggacctctgt gccacctcct acacagtatt aactcccgag atgggggtcc 1860
aaaccctggc tacaggcgtg ttcggtcctc tgccccccgg caccgccggc ctgctgctgg 1920
gcagaagcag cgccagcctg aagggcatcc tgatccatcc tggagtgatt gacagcgact 1980
acaccggcga gatcaagatc ctggcctctg cccctaacaa gatcatcgtg atcaacgccg 2040
gccaaagaat cgcccagctg ctgctcgtgc ctctggtgat ccagggcaaa accatcaacc 2100
gggacaggca ggacaaggga tttggatctt ctgacgccta ttgggtgcag aacgtgaccg 2160
aggccagacc tgaactggaa cttagaatca atggcaagct gttccggggc gtgctggata 2220
caggcgccga catcagcgtg atcagcgaca aatactggcc caccacctgg cctaagcaga 2280
tggctatctc tacactgcag ggcatcggcc agacaaccaa ccccgagcag agcagcagcc 2340
tgctgacctg gaaggacaag gacggccaca ccggccaatt caagccctac atcctgcctc 2400
acctgcctgt gaacctgtgg ggcagagata tcctgagcaa gatgggcgtc tacctgtact 2460
cccctagccc taccgtgaca gatctgatgc tggaccaggg cctgctgcct aatcagggcc 2520
tcggaaagca acaccaggga attatcctgc cactggacct gaaaagcaac caggatagaa 2580
agggcctggg atgcttcccc tgaggacctc tgattctcct gggtgccgac tgcctggatt 2640
tcgacaatga cggcggcagc ccaaagaaga agcggaaggt ctctagacaa gagatcaaga 2700
gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag gccggcaaga 2760
caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga gagcggctgg 2820
aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc agcagggcca 2880
acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg cacgtgtact 2940
gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag cctgccagca 3000
agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat ctgaccacag 3060
ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt 3120
ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc gagcacgaga 3180
agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc gtgacctaca 3240
gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg accaaagaaa 3300
gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc tctggacctg 3360
tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc 3420
aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc 3480
tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg cctcctcagc 3540
ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg agaatgtggg 3600
tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag cctctgctga 3660
gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa gtggattggt 3720
gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat ggcaaggttt 3780
tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac ctgagcagcg 3840
aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac ctgctgctgc 3900
acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc tgggagagaa 3960
tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa agaaggagcg 4020
aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc agctttgtga 4080
tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg aagctgcaga 4140
agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac agcatcctgg 4200
acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa gacggcgtca 4260
agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg cggttcaaga 4320
agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac aaaaagtccg 4380
gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg attatcctgc 4440
ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg ctgagcctgg 4500
aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg tacaacagga 4560
gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga agagaggtgc 4620
tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc gagaatatcc 4680
ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc aaggactccc 4740
tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag cagaggacaa 4800
tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg aagtacgcca 4860
gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat ctgctgtact 4920
acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc ttcggccggc 4980
agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat tggctcacag 5040
ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg gcccagtata 5100
cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac gacagagtgc 5160
tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc aaagagctga 5220
aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc gtgaaggatc 5280
tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc agcagctgga 5340
caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc cacagacctg 5400
tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat gaacaggctg 5460
ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag aagtaccaga 5520
ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg cagagcttct 5580
acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa 5640
aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5684
<210> 885
<211> 5637
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP43 plasmid sequence
<400> 885
atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60
tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120
aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180
ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240
tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300
agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360
agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420
accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480
gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540
gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600
aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660
cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720
gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780
gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840
gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900
cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960
tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020
gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080
aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140
tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200
gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260
ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320
atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380
tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440
agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500
agaggacaaa agtacagcac cttcgtgaaa cagacatacg gcggcggaaa aggcggacag 1560
ggctctgaag gccctgtgtg cttcagctgc ggcaaaacag gtcacattaa gcgggattgc 1620
aaggaagaga aaggaagcaa gcgcgctcct cctggactgt gtcctagatg caagaaaggc 1680
taccactgga agagcgagtg caagagcaag ttcgacaagg acggcaaccc tctgccacca 1740
ctggaaacta acgccgaaaa cagcaaaaac cccacacaga aaggcgacaa aggaaaggac 1800
agcggactga accccgaagc ccctcctttc accatccacg acctgccacg aggcacccca 1860
ggcagtgccg gcttggacct gagcagccag aaagacctga tcctgtctct ggaagacggc 1920
gtgtccctgg tgccaaccct ggtgaagggc accctgcccg agggcaccac gggactgatc 1980
atcggcagat ccagcaacta caagaaaggc ctggaggtgc tgcccggcgt gatcgactcc 2040
gacttccagg gcgaaattaa ggtcatggta aaggccgcta agaacgccgt gatcatccac 2100
aagggcgagc ggatcgcgca gctgctgctg ctgccttatc tgaaactgcc taaccctatc 2160
atcaaggagg aaagaggcag cgagggattt ggcagcacct cccacgtgca ctgggtgcag 2220
gagatcagcg acagcagacc catgctgcac atcagcctga acggcagaag attcctgggc 2280
ctgctggaca ccggggccga taagacctgc atcgccggca gagattggcc cgccaactgg 2340
cctattcacc agaccgagag cagcctgcag ggcttgggaa tggcttgtgg cgtggctaga 2400
agctctcagc ctctgagatg gcagcacgag gataagtctg gcattatcca tcctttcgtg 2460
atccccacat tgccttttac cctctggggc cgggacatca tgaaagagat aaaggtgcgg 2520
ctgatgaccg atagcccaga cgacagccag gatctgacat ctctgtacgg cttaggtgcc 2580
gacctggtgc tgctgagcgc cgagggcggc agcccaaaga agaagcggaa ggtctctaga 2640
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2700
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2760
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2820
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2880
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2940
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 3000
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 3060
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 3120
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 3180
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 3240
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 3300
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 3360
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 3420
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 3480
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 3540
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 3600
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3660
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3720
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3780
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3840
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3900
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3960
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 4020
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 4080
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 4140
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 4200
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 4260
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 4320
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 4380
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 4440
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 4500
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 4560
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 4620
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4680
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4740
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4800
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4860
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4920
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4980
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 5040
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 5100
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 5160
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 5220
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 5280
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 5340
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 5400
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 5460
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 5520
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 5580
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 5637
<210> 886
<211> 5811
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP44 plasmid sequence
<400> 886
atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60
acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120
acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180
gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240
agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300
gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360
accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420
tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480
ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540
gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600
agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660
cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720
ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780
caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840
aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900
gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960
gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020
ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080
gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140
tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200
accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260
gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320
ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380
agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440
aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500
aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560
cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaaggactt cctgaacaac 1620
aagaacaagg aaaagggcgg atgttgtttt aagtgcggca agaaaggaca ctttgccaaa 1680
aactgccacg agcacgccca caacaacgcc gagcccaagg tgcccggcct gtgtcctcgg 1740
tgcaagagag gcaagcactg ggccaatgag tgcaagtcca agacagataa ccagggaaat 1800
ccaatccccc cccatcaggg aaatggtgct tctcctagac ctagaaacaa gctgatgggc 1860
caaagcgccc tgttccagcc taccaagaca acccacttca aggcctacca gagccacccc 1920
agaaagtgca gaatcggccc tctgttccac ctgccccaca gcatcaacgc ctgaaatggg 1980
gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040
cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100
tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160
tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220
acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccagcc 2280
tatcacctgt cagaagcctt ctctgaccct gtggctggac gacaagatgt tcaccggcct 2340
catcgacacc ggcgccgacg tgacaatcat caagctggaa gattggcctc caaattggcc 2400
cattacagat accctgacca acctgagagg catcggacag tccaacaacc ccaagcagag 2460
cagcaagtac ctgacatggc gggacaagga gaacaacagc ggcctgatca aaccttttgt 2520
gatccccaat ctgcctgtga acctgtgggg aagagatctg ctgtctcaga tgaagatcat 2580
gatgtgcagc ccaaacgaca tcgtgaccgc ccagatgctg gctcaaggct acagccccgg 2640
caaaggcctg ggcaagaaag agaatggaat cctgcaccct atccctaacc agggccagag 2700
caacaagaag ggcttcggca acttctgact gcggccattg acatacttgg tgccccacag 2760
gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820
atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880
ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940
cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000
agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060
gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120
gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180
accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240
caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300
cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360
acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420
aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480
ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540
aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600
gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660
cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720
atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780
ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840
gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900
aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960
agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020
ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080
gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140
aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200
tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260
ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320
atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380
ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440
ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500
aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560
atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620
agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680
aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740
gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800
aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860
gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920
aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980
tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040
ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100
ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160
ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220
cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280
agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340
gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400
aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460
agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520
agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580
caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640
taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700
agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760
aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811
<210> 887
<211> 4779
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP45 plasmid sequence
<400> 887
atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60
ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120
aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180
ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240
aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300
ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360
agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420
ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480
gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540
acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600
cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660
cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720
ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780
cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840
ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900
aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960
gccctgctgg tgcacacccc aggaccaaag atgcctggac cacgccagcc agcacctaag 1020
aggccaccac ctggaccttg ctacagatgt ctgaaggagg gacactgggc cagggactgc 1080
ccaacaaagg caaccggccc accacctgga ccatgcccca tctgtaagga cccaagccac 1140
tggaagcgcg attgtcccac actgaagtcc aagaattaat agagggggga cttagcgccc 1200
cccaaaccat aacacctata acagattctc ttagtgaggc cgaattagaa tgcttactct 1260
ctattcctct ggcccggagc cgccctagcg tggccgtgta cctgagcggc ccttggctgc 1320
aaccttctca gaaccaggcc ctgatgctgg ttgatacagg cgccgagaac accgtgctgc 1380
ctcagaattg gctggtgcgg gactacccca gaatccctgc cgctgtgctg ggagccggag 1440
gcgtgtcccg gaacagatac aactggctgc agggccctct tacactggct ctgaaacctg 1500
aaggcccatt catcaccatc ccaaagatcc tggtcgacac cttcgacaag tggcagatcc 1560
tgggcagaga tgtgctgagc agactgcagg ccagcatcag catccccgag gaagtgcggc 1620
cccccgtggt gggcgtcttg gatgcccccc cgagccacat tggattagaa catctgcccc 1680
ccccacctga ggtgcctcaa ttccctttaa actagaggtg ccccagccat cctgcccatc 1740
atctccggcg gcagcccaaa gaagaagcgg aaggtctcta gacaagagat caagagaatc 1800
aacaagatca gaaggagact ggtcaaggac agcaacacaa agaaggccgg caagacaggc 1860
cccatgaaaa ccctgctcgt cagagtgatg acccctgacc tgagagagcg gctggaaaac 1920
ctgagaaaga agcccgagaa catccctcag cctatcagca acaccagcag ggccaacctg 1980
aacaagctgc tgaccgacta caccgagatg aagaaagcca tcctgcacgt gtactgggaa 2040
gagttccaga aagaccccgt gggcctgatg agcagagttg ctcagcctgc cagcaagaag 2100
atcgaccaga acaagctgaa gcccgagatg gacgagaagg gcaatctgac cacagccggc 2160
tttgcctgct ctcagtgtgg ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag 2220
aaaggcaagg cctacaccaa ctacttcggc agatgtaacg tggccgagca cgagaagctg 2280
attctgctgg cccagctgaa acctgagaag gactctgatg aggccgtgac ctacagcctg 2340
ggcaagtttg gacagagagc cctggacttc tacagcatcc acgtgaccaa agaaagcaca 2400
caccccgtga agcccctggc tcagatcgcc ggcaatagat acgcctctgg acctgtgggc 2460
aaagccctgt ccgatgcctg catgggaaca atcgccagct tcctgagcaa gtaccaggac 2520
atcatcatcg agcaccagaa ggtggtcaag ggcaaccaga agagactgga aagcctgagg 2580
gagctggccg gcaaagagaa cctggaatac cccagcgtga ccctgcctcc tcagcctcac 2640
acaaaagaag gcgtggacgc ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac 2700
ctgaacctgt ggcagaagct gaaactgtcc agggacgacg ccaagcctct gctgagactg 2760
aagggcttcc ctagcttccc tctggtggaa agacaggcca atgaagtgga ttggtgggac 2820
atggtctgca acgtgaagaa gctgatcaac gagaagaaag aggatggcaa ggttttctgg 2880
cagaacctgg ccggctacaa gagacaagaa gccctgaggc cttacctgag cagcgaagag 2940
gaccggaaga agggcaagaa gttcgccaga taccagctgg gcgacctgct gctgcacctg 3000
gaaaagaagc acggcgagga ctggggcaaa gtgtacgatg aggcctggga gagaatcgac 3060
aagaaggtgg aaggcctgag caagcacatt aagctggaag aggaaagaag gagcgaggac 3120
gcccaatcta aagccgctct gaccgattgg ctgagagcca aggccagctt tgtgatcgag 3180
ggcctgaaag aggccgacaa ggacgagttc tgcagatgcg agctgaagct gcagaagtgg 3240
tacggcgatc tgagaggcaa gcccttcgcc attgaggccg agaacagcat cctggacatc 3300
agcggcttca gcaagcagta caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa 3360
ctgaacctgt acctgatcat caattacttc aaaggcggca agctgcggtt caagaagatc 3420
aaacccgagg ccttcgaggc taacagattc tacaccgtga tcaacaaaaa gtccggcgag 3480
atcgtgccca tggaagtgaa cttcaacttc gacgacccca acctgattat cctgcctctg 3540
gccttcggca agagacaggg cagagagttc atctggaacg atctgctgag cctggaaacc 3600
ggctctctga agctggccaa tggcagagtg atcgagaaaa ccctgtacaa caggagaacc 3660
agacaggacg agcctgctct gtttgtggcc ctgaccttcg agagaagaga ggtgctggac 3720
agcagcaaca tcaagcccat gaacctgatc ggcgtggacc ggggcgagaa tatccctgct 3780
gtgatcgccc tgacagaccc tgaaggatgc ccactgagca gattcaagga ctccctgggc 3840
aaccctacac acatcctgag aatcggcgag agctacaaag agaagcagag gacaatccag 3900
gccaagaaag aggtggaaca gagaagagcc ggcggatact ctaggaagta cgccagcaag 3960
gccaagaatc tggccgacga catggtccga aacaccgcca gagatctgct gtactacgcc 4020
gtgacacagg acgccatgct gatcttcgag aatctgagca gaggcttcgg ccggcagggc 4080
aagagaacct ttatggccga gaggcagtac accagaatgg aagattggct cacagctaaa 4140
ctggcctacg agggactgag caagacctac ctgtccaaaa cactggccca gtatacctcc 4200
aagacctgca gcaattgcgg cttcaccatc accagcgccg actacgacag agtgctggaa 4260
aagctcaaga aaaccgccac cggctggatg accaccatca acggcaaaga gctgaaggtt 4320
gagggccaga tcacctacta caacaggtac aagaggcaga acgtcgtgaa ggatctgagc 4380
gtggaactgg acagactgag cgaagagagc gtgaacaacg acatcagcag ctggacaaag 4440
ggcagatcag gcgaggctct gagcctgctg aagaagaggt ttagccacag acctgtgcaa 4500
gagaagttcg tgtgcctgaa ctgcggcttc gagacacacg ccgatgaaca ggctgccctg 4560
aacattgcca gaagctggct gttcctgaga agccaagagt acaagaagta ccagaccaac 4620
aagaccaccg gcaacaccga caagagggcc tttgtggaaa cctggcagag cttctacaga 4680
aaaaagctga aagaagtctg gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta 4740
gccctcgagt acccatatga tgtccctgac tacgcttga 4779
<210> 888
<211> 5078
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP46 plasmid sequence
<400> 888
atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60
gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120
tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180
tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240
aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300
cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360
tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420
aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480
gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540
acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600
caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660
aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720
agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780
ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840
ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900
tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960
accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020
accaaggtgc tggtggtgca gcctaagaag cctcccccta atcagccctg cttccggtgc 1080
ggcaaggccg gacactggag ccgggactgc acccagcctc ggcctccacc gggaccttgt 1140
cctctgtgcc aagaccccac acactggaag agagattgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggaggtttaa cctctcctcc taccctgcag caggtgttcc 1320
tgaatcaaga tcctgccagc atcctgcctg tgatccccct cgaccccgct agaagacctg 1380
tgatcaaggc ccaggtggac acacagacct cccaccccaa aacaatcgag gccctgctgg 1440
acaccggcgc tgatatgaca gtgctgccaa tcgccctgtt cagcagcaac acccctctga 1500
aaaacaccag cgtgctcgga gccggcggac agacccagga ccacttcaag ctgacaagcc 1560
tgcctgtcct gatccggctg cccttcagaa ccacacctat cgtgctgacc agctgcctgg 1620
tggacacaaa gaacaactgg gccatcatcg gcagggacgc cctgcaacag tgccagggcg 1680
tgctgtacct gccagaggcc aagggccccc ccgttatcct gcctatccag gcccctgccg 1740
tgctgggcct ggaacacctg ccaagacccc cccagatcag ccaatttcct ctgaaccaga 1800
acgccagcag accatgtaat acctggtccg gcagaccttg gcggcaggcc atttctaacc 1860
ccacccccgg ccaggagatc acccagtaca gccagctgaa gcggcctatg gaacctggag 1920
attctagcac cacctgcggc cctctgacac tgtgaccata gacctctcat catcttcccc 1980
cgggccccct gacttgtcca gcctgccaac cacacggtgc ccctcaagtg ctgccagtga 2040
tgcacggcgg cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca 2100
acaagatcag aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc 2160
ccatgaaaac cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc 2220
tgagaaagaa gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga 2280
acaagctgct gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag 2340
agttccagaa agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga 2400
tcgaccagaa caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct 2460
ttgcctgctc tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga 2520
aaggcaaggc ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga 2580
ttctgctggc ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg 2640
gcaagtttgg acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac 2700
accccgtgaa gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca 2760
aagccctgtc cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca 2820
tcatcatcga gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg 2880
agctggccgg caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca 2940
caaaagaagg cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc 3000
tgaacctgtg gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga 3060
agggcttccc tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca 3120
tggtctgcaa cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc 3180
agaacctggc cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg 3240
accggaagaa gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg 3300
aaaagaagca cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca 3360
agaaggtgga aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg 3420
cccaatctaa agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg 3480
gcctgaaaga ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt 3540
acggcgatct gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca 3600
gcggcttcag caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac 3660
tgaacctgta cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca 3720
aacccgaggc cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga 3780
tcgtgcccat ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg 3840
ccttcggcaa gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg 3900
gctctctgaa gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca 3960
gacaggacga gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca 4020
gcagcaacat caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg 4080
tgatcgccct gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca 4140
accctacaca catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg 4200
ccaagaaaga ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg 4260
ccaagaatct ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg 4320
tgacacagga cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca 4380
agagaacctt tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac 4440
tggcctacga gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca 4500
agacctgcag caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa 4560
agctcaagaa aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg 4620
agggccagat cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg 4680
tggaactgga cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg 4740
gcagatcagg cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag 4800
agaagttcgt gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga 4860
acattgccag aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca 4920
agaccaccgg caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa 4980
aaaagctgaa agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag 5040
ccctcgagta cccatatgat gtccctgact acgcttga 5078
<210> 889
<211> 5244
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP47 plasmid sequence
<400> 889
atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60
accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120
aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180
gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240
cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300
aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360
acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420
aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480
ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540
aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600
gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660
aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720
aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780
ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840
aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900
atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960
acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020
aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080
accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140
gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200
aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260
gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320
cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380
gcccagacaa tgaacggcaa taagggctac gtgggctcct atcctaccaa cgagccatac 1440
tattctttcc agcagcagca gaggccagca cccagagccc ctccaggcaa cgtgccttcc 1500
aatacctgct tcttttgtaa gcagccagga cactggaagg cagactgccc taataagaca 1560
aggaacctgc gcaatatggg caacatggga aggggaggaa gaatgggagg accaccttac 1620
cggagccagc cttatccagc ctttatccag ccaccccaga atcaccagaa ccagtataat 1680
ggcaggatgg atcgctctca gctgcaggcc agcgcccagg agtggctgcc aggaacctac 1740
cctgcatgag acccaatcga ttgcccctat gagaagagcg gcacaaagac cacacaggac 1800
gtgatcacca caaagaatgc cgagatcatg gtgaccgtga accacacaaa gatcccaatg 1860
ctggtggata ccggcgcctg tctgacagca atcggaggag cagcaaccgt ggtgccagac 1920
ctgaagctga ccaacacaga gatcatcgca gtgggaatct ctgccgagcc cgtgcctcac 1980
gtgctggcca agccaaccaa gatccagatc gagaacacaa atatcgatat cagcccttgg 2040
tacaatccag accagacctt ccacatcctg ggccgcgaca cactgtctaa gatgcgggcc 2100
atcgtgagct ttgagaagaa cggcgagatg accgtgctgc tgcctccaac atatcacaag 2160
cagctgtcct gtcagaccaa gggtgccgca aggcagatga ccgcacacac aggcggcagc 2220
ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 2280
agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 2340
ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 2400
gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 2460
gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 2520
cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 2580
ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 2640
tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2700
accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2760
ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2820
agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2880
ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2940
gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 3000
cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 3060
gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 3120
gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 3180
aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 3240
ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 3300
aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 3360
tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 3420
aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 3480
gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 3540
ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 3600
gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3660
gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3720
ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3780
cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3840
atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3900
gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3960
gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 4020
cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 4080
gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 4140
gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 4200
cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 4260
gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 4320
ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 4380
gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 4440
gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 4500
atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 4560
gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 4620
ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4680
tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4740
gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4800
tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4860
ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4920
gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4980
ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 5040
tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 5100
accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 5160
gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 5220
tatgatgtcc ctgactacgc ttga 5244
<210> 890
<211> 4962
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP48 plasmid sequence
<400> 890
atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60
gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120
gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180
atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240
ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300
ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360
cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420
ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480
cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540
tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600
gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660
aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720
atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780
accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840
ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900
tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960
gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020
cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080
tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140
taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200
acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260
gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320
atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaagacag agaggaatcg 1380
aagctgggcg accagagaaa gatccccctt ggcaaggacc aatgtgccta ctgcaaggaa 1440
aaaggccact gggtgaggga ctgtcccaag agacccagaa agaagcccgc aaacagcaca 1500
ctgctgaacc tgggcgatca ggagagccaa ggccaggacc cccctcctga gcctagaatc 1560
accctgaaga ttggaggcca gcctgtgacc tttctggtgg acaccggcgc ccaacactct 1620
gtgctgacca gacctgatgg ccccctcagc gatagaaccg ccctggtcca gggagctaca 1680
ggcagcaaga actacagatg gaccaccgac agaagggtgc agctggctac tggcaaggtg 1740
acacacagct ttctgtacgt gcccgagtgc ccttaccccc tcctgggcag agatctgttg 1800
acaaagctga aggcccaaat ccacttcacc ggagagggcg ctaatgtggt gggccccaag 1860
ggcctgcctc ttcaggtgct gacactgcaa ctggaagagg gtgccagctc tctgtaccct 1920
gtgctgcctg gcggcagccc aaagaagaag cggaaggtct ctagacaaga gatcaagaga 1980
atcaacaaga tcagaaggag actggtcaag gacagcaaca caaagaaggc cggcaagaca 2040
ggccccatga aaaccctgct cgtcagagtg atgacccctg acctgagaga gcggctggaa 2100
aacctgagaa agaagcccga gaacatccct cagcctatca gcaacaccag cagggccaac 2160
ctgaacaagc tgctgaccga ctacaccgag atgaagaaag ccatcctgca cgtgtactgg 2220
gaagagttcc agaaagaccc cgtgggcctg atgagcagag ttgctcagcc tgccagcaag 2280
aagatcgacc agaacaagct gaagcccgag atggacgaga agggcaatct gaccacagcc 2340
ggctttgcct gctctcagtg tggccagcct ctgttcgtgt acaagctgga acaggtgtcc 2400
gagaaaggca aggcctacac caactacttc ggcagatgta acgtggccga gcacgagaag 2460
ctgattctgc tggcccagct gaaacctgag aaggactctg atgaggccgt gacctacagc 2520
ctgggcaagt ttggacagag agccctggac ttctacagca tccacgtgac caaagaaagc 2580
acacaccccg tgaagcccct ggctcagatc gccggcaata gatacgcctc tggacctgtg 2640
ggcaaagccc tgtccgatgc ctgcatggga acaatcgcca gcttcctgag caagtaccag 2700
gacatcatca tcgagcacca gaaggtggtc aagggcaacc agaagagact ggaaagcctg 2760
agggagctgg ccggcaaaga gaacctggaa taccccagcg tgaccctgcc tcctcagcct 2820
cacacaaaag aaggcgtgga cgcctacaac gaagtgatcg ccagagtgag aatgtgggtc 2880
aacctgaacc tgtggcagaa gctgaaactg tccagggacg acgccaagcc tctgctgaga 2940
ctgaagggct tccctagctt ccctctggtg gaaagacagg ccaatgaagt ggattggtgg 3000
gacatggtct gcaacgtgaa gaagctgatc aacgagaaga aagaggatgg caaggttttc 3060
tggcagaacc tggccggcta caagagacaa gaagccctga ggccttacct gagcagcgaa 3120
gaggaccgga agaagggcaa gaagttcgcc agataccagc tgggcgacct gctgctgcac 3180
ctggaaaaga agcacggcga ggactggggc aaagtgtacg atgaggcctg ggagagaatc 3240
gacaagaagg tggaaggcct gagcaagcac attaagctgg aagaggaaag aaggagcgag 3300
gacgcccaat ctaaagccgc tctgaccgat tggctgagag ccaaggccag ctttgtgatc 3360
gagggcctga aagaggccga caaggacgag ttctgcagat gcgagctgaa gctgcagaag 3420
tggtacggcg atctgagagg caagcccttc gccattgagg ccgagaacag catcctggac 3480
atcagcggct tcagcaagca gtacaactgc gccttcattt ggcagaaaga cggcgtcaag 3540
aaactgaacc tgtacctgat catcaattac ttcaaaggcg gcaagctgcg gttcaagaag 3600
atcaaacccg aggccttcga ggctaacaga ttctacaccg tgatcaacaa aaagtccggc 3660
gagatcgtgc ccatggaagt gaacttcaac ttcgacgacc ccaacctgat tatcctgcct 3720
ctggccttcg gcaagagaca gggcagagag ttcatctgga acgatctgct gagcctggaa 3780
accggctctc tgaagctggc caatggcaga gtgatcgaga aaaccctgta caacaggaga 3840
accagacagg acgagcctgc tctgtttgtg gccctgacct tcgagagaag agaggtgctg 3900
gacagcagca acatcaagcc catgaacctg atcggcgtgg accggggcga gaatatccct 3960
gctgtgatcg ccctgacaga ccctgaagga tgcccactga gcagattcaa ggactccctg 4020
ggcaacccta cacacatcct gagaatcggc gagagctaca aagagaagca gaggacaatc 4080
caggccaaga aagaggtgga acagagaaga gccggcggat actctaggaa gtacgccagc 4140
aaggccaaga atctggccga cgacatggtc cgaaacaccg ccagagatct gctgtactac 4200
gccgtgacac aggacgccat gctgatcttc gagaatctga gcagaggctt cggccggcag 4260
ggcaagagaa cctttatggc cgagaggcag tacaccagaa tggaagattg gctcacagct 4320
aaactggcct acgagggact gagcaagacc tacctgtcca aaacactggc ccagtatacc 4380
tccaagacct gcagcaattg cggcttcacc atcaccagcg ccgactacga cagagtgctg 4440
gaaaagctca agaaaaccgc caccggctgg atgaccacca tcaacggcaa agagctgaag 4500
gttgagggcc agatcaccta ctacaacagg tacaagaggc agaacgtcgt gaaggatctg 4560
agcgtggaac tggacagact gagcgaagag agcgtgaaca acgacatcag cagctggaca 4620
aagggcagat caggcgaggc tctgagcctg ctgaagaaga ggtttagcca cagacctgtg 4680
caagagaagt tcgtgtgcct gaactgcggc ttcgagacac acgccgatga acaggctgcc 4740
ctgaacattg ccagaagctg gctgttcctg agaagccaag agtacaagaa gtaccagacc 4800
aacaagacca ccggcaacac cgacaagagg gcctttgtgg aaacctggca gagcttctac 4860
agaaaaaagc tgaaagaagt ctggaagccc gccgtgacta gtccaaaaaa gaagagaaag 4920
gtagccctcg agtacccata tgatgtccct gactacgctt ga 4962
<210> 891
<211> 5061
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP49 plasmid sequence
<400> 891
atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60
cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120
gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180
atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240
ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300
gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360
cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420
aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480
gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540
gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600
aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660
ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720
aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780
atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840
gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900
cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960
tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020
ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080
cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140
ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200
tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260
ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320
gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380
cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440
gtggtgtccg gacagaagca ggacaggcag ggaggagaga ggcgccggtc tcagctggac 1500
cgcgatcagt gcgcctactg taaggagaag ggccactggg ccaaggattg ccccaagaag 1560
cctagaggcc caaggggccc taggccacag accagcctgc tgacactgga cgattgagga 1620
ggacagggac aggagccacc tccagagccc agaatcaccc tgaaggtcgg cggccagcct 1680
gtgacctttc tggtggacac aggcgcccag cacagcgtgc tgacccagaa tcccggccct 1740
ctgtctgata agagcgcctg ggtgcaggga gcaacaggcg gcaagcggta cagatggacc 1800
acagaccgga aggtgcacct ggccaccggc aaggtgacac acagctttct gcacgtgccc 1860
gactgtccat accccctgct gggcagagat ctgctgacca agctgaaggc acagatccac 1920
ttcgagggat ccggagcaca ggtcatggga ccaatgggac agcctctgca ggtgctgaca 1980
ctgaacatcg aggatgaggg tgccagctcc ctgtatcctg ccctgacagg cggcagccca 2040
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 2100
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 2160
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 2220
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2280
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2340
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2400
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2460
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2520
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2580
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2640
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2700
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2760
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2820
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2880
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2940
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 3000
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 3060
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 3120
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 3180
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3240
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3300
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3360
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3420
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3480
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3540
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3600
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3660
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3720
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3780
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3840
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3900
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3960
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 4020
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 4080
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 4140
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 4200
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4260
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4320
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4380
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4440
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4500
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4560
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4620
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4680
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4740
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4800
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4860
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4920
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4980
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 5040
gatgtccctg actacgcttg a 5061
<210> 892
<211> 4757
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP50 plasmid sequence
<400> 892
atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60
gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120
ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180
aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240
acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300
atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360
atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420
agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480
gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540
gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600
gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720
cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780
agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840
aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900
gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960
aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020
ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080
ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggcctgg caagggcaag 1140
ggaaacggac agccacagcg gtgctacaat tgtggcaagc caggacacca ggcaaggcag 1200
tgcaggcagg gcatcatatg tcacaactgt ggaaagagag gacatatgca aaaagaatgc 1260
agaggaaaga gagacataag gggaaaacag cagggaaacg ggaggagggg gatacgtgtg 1320
gtgccgtccg ctcctcctat ggaataacaa gcgcccctcc aatggtgcag gtgcggattg 1380
gatctcagca gcgcaacctg ctgttcgaca ccggcgccga tagaaccatc gtccggtggc 1440
acgagggctc cggcaacccc gccggcagaa tcaaactgca aggcatcggc ggaatcgtgg 1500
aaggcgagaa gtggaacaac gtggagctgg aatacaaggg cgagacaaga aagggcacca 1560
tcgtggtgct gcctcagagc cctgtggagg tgctgggacg ggacaacatg gcccggttcg 1620
gcatcaagat catcatggct aatctggagg aaaaaagaat ccccatcacc aaggtgaagt 1680
tgaaagaggg atgtggtgcc gcaggaggcc ggtcctggaa ggccggcggc agcccaaaga 1740
agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga aggagactgg 1800
tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc ctgctcgtca 1860
gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag cccgagaaca 1920
tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg accgactaca 1980
ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg 2040
gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac aagctgaagc 2100
ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct cagtgtggcc 2160
agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc tacaccaact 2220
acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc cagctgaaac 2280
ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga cagagagccc 2340
tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag cccctggctc 2400
agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc gatgcctgca 2460
tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag caccagaagg 2520
tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc aaagagaacc 2580
tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc gtggacgcct 2640
acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg cagaagctga 2700
aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct agcttccctc 2760
tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc 2820
tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc ggctacaaga 2880
gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag ggcaagaagt 2940
tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac ggcgaggact 3000
ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca 3060
agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa gccgctctga 3120
ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag gccgacaagg 3180
acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg agaggcaagc 3240
ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc aagcagtaca 3300
actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac ctgatcatca 3360
attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc ttcgaggcta 3420
acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact 3480
tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag agacagggca 3540
gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg 3600
gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag cctgctctgt 3660
ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc aagcccatga 3720
acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg acagaccctg 3780
aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac atcctgagaa 3840
tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag gtggaacaga 3900
gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg gccgacgaca 3960
tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac gccatgctga 4020
tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt atggccgaga 4080
ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag ggactgagca 4140
agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc aattgcggct 4200
tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa accgccaccg 4260
gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc acctactaca 4320
acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac agactgagcg 4380
aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc gaggctctga 4440
gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg tgcctgaact 4500
gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga agctggctgt 4560
tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc aacaccgaca 4620
agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa gaagtctgga 4680
agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg 4740
tccctgacta cgcttga 4757
<210> 893
<211> 4821
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP51 plasmid sequence
<400> 893
atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60
ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120
cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180
gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240
gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300
tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360
agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420
cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480
tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540
ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600
atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660
cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720
cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780
atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840
gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900
caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960
gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020
gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080
acaggcctgg ccggaccatt caagggaggc gccctgaagg gcggccccct gaaggccgcc 1140
cagacctgct ataactgtgg caagccagga cacctgagct cccagtgcag ggcaccaaag 1200
gtgtgcttca agtgtaagca gcctggccac ttttctaagc aatgcagaag tgttccaaaa 1260
aacgggaagc aaggggctca agggaggccc cagaaacaaa ctttcccgat acaacagaag 1320
agtcagcaca acaaatctgt tgtacaagag actcctcaga ctcaaaatct gtacccagat 1380
ctgagcgaaa taaaaaagga atacaatgtc aaggagaagg atcaagtaga ggatctcaac 1440
ctggacagtt tgtgggagta aacatataac ctggagaagc gccccaccac aatcgtgctg 1500
atcaacgaca cccctctgaa cgtgctgctg gacacaggag ctgatacatc tgtgctcacc 1560
accgcccact acaaccggct gaagtacaga ggcagaaagt accagggcac cggcatcatc 1620
ggcgtgggcg gaaatgtgga aaccttcagc accccagtga ccattaagaa aaagggccgg 1680
cacatcaaaa ccagaatgct ggtcgccgac atccctgtga caatcctggg cagagatatc 1740
cttcaggact taggtgcagg tgccagcgag gagtatccaa tcatgatcgg cggcagccca 1800
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1860
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1920
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1980
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2040
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2100
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2160
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2220
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2280
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2340
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2400
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2460
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2520
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2580
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2640
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2700
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2760
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2820
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2880
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2940
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3000
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3060
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3120
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3180
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3240
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3300
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3360
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3420
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3480
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3540
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3600
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3660
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3720
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3780
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3840
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3900
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3960
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4020
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4080
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4140
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4200
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4260
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4320
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4380
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4440
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4500
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4560
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4620
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4680
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4740
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4800
gatgtccctg actacgcttg a 4821
<210> 894
<211> 4871
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP52 plasmid sequence
<400> 894
atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60
ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120
ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180
ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240
acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300
aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360
accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420
ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480
gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540
tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600
cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660
ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720
acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780
ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840
ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900
agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960
cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020
atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080
aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctgacca gctgccattt 1140
gccgccgtgc agcagaaggg ccagaggaag accatcaagt gctggaactg tggcaaggag 1200
ggacactctg ccaagcagtg cagggcacca aggcgccagg gatgctggaa gtgtggcaag 1260
acaggccacg tgatggccaa gtgtcctgag aggcaggcag gcttcctggg actgggacca 1320
tggggcaaga agccaagaaa ttttcctatg gcccagatgc ctcagggact gatcccaacc 1380
gcaccaccag aggacccagc agtggatctg ctgaagaact acatgaagat gggcaggaag 1440
cagcgcgaga atagggagcg cccttataag gaggtgacag aggacctgct gcacctgaac 1500
tctctctttg gagaagacca gtagttacag cctacatcga ggaacagcct gtggaagtgc 1560
tgctggatac aggagctgat gacagcatcg tggccggcat tgagctggga cctaactaca 1620
ccccaaagat cgtgggcggc atcggcggat tcatcaatac caaagagtac aaggacgtga 1680
agatcaaagt gctgggcaag gtgatcaagg gcaccatcat gaccggcgac acacccatca 1740
acatcttcgg cagaaacctg ctcaccgcca tgggcatgtc tctgaacctg cctatcgcca 1800
aggtcgaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860
ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920
acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980
tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040
agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100
tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160
tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220
tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280
tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340
gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400
aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460
tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520
ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580
caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640
agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700
accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760
aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820
ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880
aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940
acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000
aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060
gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120
aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180
ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240
ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300
tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360
ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420
ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480
tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540
tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600
tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660
tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720
tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780
ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840
tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900
gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960
agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020
ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080
gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140
agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200
acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260
acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320
tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380
tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440
acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500
gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560
tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620
tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680
gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740
cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800
ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860
actacgcttg a 4871
<210> 895
<211> 4700
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP53 plasmid sequence
<400> 895
atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60
gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120
tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180
acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240
agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300
aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360
aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420
gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480
gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540
gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600
gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720
atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780
atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840
ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900
ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960
accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020
acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080
gagggcttta agatgcagct gctggcccag gccctgagac ctcagggcaa ggcaggacag 1140
aagggagtga accagaagtg ctacaattgt ggcaagccag gacacctggc aaggcagtgc 1200
agacagggaa tcatctgcca ccactgtggc aagaggggcc acatgcagaa ggactgtcgc 1260
cagaagaagc agcagggcaa caataggaga ggaccaaggg tggtgccatc tgccccacca 1320
atgctgtgac agaggcccct cctaagatcg agatcaaggt gggcacaaga tggaagaaac 1380
tgctggtcga caccggcgct gataagacca tcgtgaccag ccacgacatg agcggcatcc 1440
ccaagggcag aatcatcctg cagggcattg gaggaatcat cgagggcgag aagtgggagc 1500
aggtgcacct gcagtacaag gacaagatca tccggggcac catcgtggtg ctcgccacat 1560
ctccagtgga agtgctggga agagataaca tgcgggaact gggcatcggc ctgatcatgg 1620
ctaacctgga agagaaaggt gccagggagg tgtatccaat cgtgaatggc ggcagcccaa 1680
agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc agaaggagac 1740
tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa accctgctcg 1800
tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag aagcccgaga 1860
acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg ctgaccgact 1920
acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag aaagaccccg 1980
tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag aacaagctga 2040
agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg 2100
gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag gcctacacca 2160
actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg gcccagctga 2220
aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt ggacagagag 2280
ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg aagcccctgg 2340
ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg tccgatgcct 2400
gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc gagcaccaga 2460
aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc ggcaaagaga 2520
acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa ggcgtggacg 2580
cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc 2640
tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc cctagcttcc 2700
ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc aacgtgaaga 2760
agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg gccggctaca 2820
agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag aagggcaaga 2880
agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg 2940
actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg gaaggcctga 3000
gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct aaagccgctc 3060
tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa gaggccgaca 3120
aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat ctgagaggca 3180
agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc agcaagcagt 3240
acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg tacctgatca 3300
tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag gccttcgagg 3360
ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc atggaagtga 3420
acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc aagagacagg 3480
gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg aagctggcca 3540
atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac gagcctgctc 3600
tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac atcaagccca 3660
tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc ctgacagacc 3720
ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca cacatcctga 3780
gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa gaggtggaac 3840
agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat ctggccgacg 3900
acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag gacgccatgc 3960
tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc tttatggccg 4020
agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac gagggactga 4080
gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc agcaattgcg 4140
gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag aaaaccgcca 4200
ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag atcacctact 4260
acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg gacagactga 4320
gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca ggcgaggctc 4380
tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc gtgtgcctga 4440
actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc agaagctggc 4500
tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc ggcaacaccg 4560
acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg aaagaagtct 4620
ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag tacccatatg 4680
atgtccctga ctacgcttga 4700
<210> 896
<211> 5479
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP54 plasmid sequence
<400> 896
agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60
tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120
cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180
cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240
ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300
aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360
ctgtctcatc attttggcaa agaattcgcc accatggccc tgaatgattt cgaccctatc 420
gccctccagg gctacctgcc ggcccctaga gtgctgcaac acaacgacat catcatctgc 480
agagctactt ctggcccctg gggcatcggc gacagataca acctgatcag gatccacctg 540
caagaccctg ccggacagcc ccttccaatc ccccagtggg agcctatccc taaccggacc 600
gccaaccccc ggacacagcc ctaccctgtg gtgtctgccc caatggctac cctggaaaac 660
atcctgaaca actttcacat cccccacggc gtgtccagat acggccccct ggaaggcgga 720
gattaccagc ctggcgaaca gtacagccaa ggcttctgcc ctgtgaccca ggccgagatt 780
gccctgctga acggccagca cctggaagaa gagatcacaa tcctgagaga gatcacccac 840
agactgatgc agggcgtgcg gcctcctgcc gtgcctcagg gccctgctcc tcctcctcct 900
ccagctcagc ctcctgctcc cctgcctgct ccaccaattg ggcctccacc tcccgctgcc 960
cctgcccccg ccccaggccc catgcctgtg ccccagcatc tgcctattac acatatcaga 1020
gccgtgatcg gcgaaacccc cgccaacatc cgcgaggtgc cactgtggct ggctagagcc 1080
gttcccgccc tgcagggagt gtaccccgtc caggacgccg tgatgagaag ccgcaccgtg 1140
aacgccctga ccgtgcggca ccctggactg gccctggaac ctctggagtg cggcagctgg 1200
caagagtgtc tggccgccct gtggcagaga accttcggcg ccaccgccct gcacgccctg 1260
ggcgataccc tgggtcagat cgcaaacagc gacggcatcg tgatggctat cgagctgggc 1320
ctgctctttt ccgatgataa ctgggacctg gtgtggggaa tctgtagaag attcctgccc 1380
ggccaggccg tctgcgtggc cgtgcaggcc agactggatc ccctgcccga caacgctaca 1440
agaatcgtga tgatcagcca catcatccgg gacgtgtacg ccatcctggg cctggaccct 1500
ctgggcagac ccatgcagca gacactgcct agacggaaca accagcctcc cagacagcag 1560
ccacagagac ggcagcagcc tagaagaacc ggcaaccagg aggaaagagg ccagcggaac 1620
cggggccggc agaacgccca gacccctcgg caggagggca acagactgca gaacagccag 1680
ctgcctggcc ctcgcgactg ccccaacaat agcaaccagc ctcggtaccc tctgcggcca 1740
aacccccagc agccccaaag atacggccag gagcagaatc gtggcaacaa tcccaaccct 1800
tacagacaac ctacccctgg caatggaaat caaaacagaa acttcagccg ggggcctgcc 1860
ccagtcaatg agcagagcag aggcagagga agatctagcc agggtacaaa taacaccggc 1920
tcctctgctg tgcacagcgt gcggctgacc agcgccgccc ctcctatacc cccacaagat 1980
gccggcactc cgcccacttc aagtggaaat caagggcaat catcttaaag gctactggga 2040
cagcggcgcc gagatcacat gcgtgcccgc tatctacatc atcgaggaac aacctgttgg 2100
caagaagctg attacaacca tccacaacga gaaggaacat gatgtgtact acgtggaaat 2160
gaaaatcgag aagcggaagg tgcagtgtga agtgatcgcc accgccctgg attacgtgct 2220
ggtggcccct gtggacatcc cctggtataa gcctggacct ctggaactga ccatcaagat 2280
cgacgtcgag agccagaagc acaccctgat cacagagtcc accctctctc cacagggcca 2340
gatgagactg aagaaactgc tggaccagta ccaggccctg tggcagtgct gggagaacca 2400
ggtgggccac agaagaggtg cctctgctgt gcacagcgtg cggctgggcg gcagcccaaa 2460
gaagaagcgg aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact 2520
ggtcaaggac agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt 2580
cagagtgatg acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa 2640
catccctcag cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta 2700
caccgagatg aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt 2760
gggcctgatg agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa 2820
gcccgagatg gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg 2880
ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa 2940
ctacttcggc agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa 3000
acctgagaag gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc 3060
cctggacttc tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc 3120
tcagatcgcc ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg 3180
catgggaaca atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa 3240
ggtggtcaag ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa 3300
cctggaatac cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc 3360
ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct 3420
gaaactgtcc agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc 3480
tctggtggaa agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa 3540
gctgatcaac gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa 3600
gagacaagaa gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa 3660
gttcgccaga taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga 3720
ctggggcaaa gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag 3780
caagcacatt aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct 3840
gaccgattgg ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa 3900
ggacgagttc tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa 3960
gcccttcgcc attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta 4020
caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat 4080
caattacttc aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc 4140
taacagattc tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa 4200
cttcaacttc gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg 4260
cagagagttc atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa 4320
tggcagagtg atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct 4380
gtttgtggcc ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat 4440
gaacctgatc ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc 4500
tgaaggatgc ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag 4560
aatcggcgag agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca 4620
gagaagagcc ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga 4680
catggtccga aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct 4740
gatcttcgag aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga 4800
gaggcagtac accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag 4860
caagacctac ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg 4920
cttcaccatc accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac 4980
cggctggatg accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta 5040
caacaggtac aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag 5100
cgaagagagc gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct 5160
gagcctgctg aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa 5220
ctgcggcttc gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct 5280
gttcctgaga agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga 5340
caagagggcc tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg 5400
gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga 5460
tgtccctgac tacgcttga 5479
<210> 897
<211> 5764
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP55 plasmid sequence
<400> 897
agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60
tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120
cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180
cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240
ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300
aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360
ctgtctcatc attttggcaa agaattcgcc accatgagcc agccctccgc ttctggcagc 420
gccggcgccg gaggcgcccc tcagcaacct cctcctccac ctccccagcc cggacctgcc 480
gcccccgtgc ctagagccca gatcggttat ggagatctgg acgtgcttct gctgcaacag 540
gagtaccacc tcatcgatcc taatctgcaa gtgcaacacc tggacaccct gctggtgaga 600
atcacaggcg gaaactgggg ccctggcgat agattcgcca gaatcgaggt gctgctccgc 660
gacacactgg gccctctgca acagcctaga tacagatacg ccgccatgca gcaggccgac 720
ctgagaaacg acatcatcct gcacctgaac taccaggatg ccatcatcat cttcgacatg 780
atcatcccca gcgagggcgt gcaccggcac ggccctatgt ttgacggcct gtggatccac 840
ggcgacgact acagcatgaa cttccagcct atcacagccc acgagctgta cctgctgcct 900
cagcaggtgc tgaccgagga agtggaactg ctcaccgagg tgtgcaacag aatggccgat 960
tggatccggc ggcacaggtg tggcggagga agcggctcct ctcagccacc tcctccccca 1020
cctccagccg tgccagtgct gcctagtgcc cctccagcca gcagcctgcc cctgccccca 1080
cagggctggg gcatctctcc tcccgtggct accagcaccc ctggcgctgc cggacattct 1140
agcagcgccg gtcctaacat cagcctgggc ggcacctacg tgccccctcc tgtggctcct 1200
ccagcccctg tgatcggcgg ccctggcgga cccggacagc tgcctgctat ggtgcaggtg 1260
ctgcccgctc aacctgtcgt gatccccatt aacgtgatca gatctgtgtg cggcgataca 1320
cctagcaacc ctcaagacat ccctctgtgg atgggcagaa tcatccccgc cattgagggc 1380
gtctttccta ttgacaaccc caatctgaga atgagagtgg tgaacgccct gctggctctg 1440
catcctggcc tggctatcac cgaactgaat gcccagacat ggggccaggt tctggctgtg 1500
ctgcacatgc gggccctggg acacaccgcc ctgcaccagc tgcctgccct gctggaaaca 1560
atcgtgaaga ccgacggcat cctgccagct tataacatgg gcatggaagt tacacagcag 1620
gatttcagct acgtgtgggg catcctgcgg acactgttgc ccggccaagc cttcgtgctg 1680
agcatgcaga acgagctgga ccggctgcct gccgcccaga gacctggaat gttccccggc 1740
ctgctgcaga gaaccctgga tatcctgggc ctgaacagca gaggacagaa catccagaaa 1800
accaacaccc agcagcaggc cccaaagcgg ggccagaagc ctaagcccag actgccccca 1860
gtgcacagac ggcctgcacc cttcacccct cctgccaccc ccagccctcg gcagcaggcc 1920
agcgccagcc ccagcagcca gggcgacaac agaagccctc agcctcaggg cagaggcaca 1980
tacggcccga gccggggagg cggctctggc cctagataca acttccgtcc cagagtgcag 2040
cctcccgaca gatacggctt cggcagaggc cagggaggca gaagcagcat cggcgcccag 2100
gacaatcagc agcccggaca aggcggacag cggacccagc agaccaacca gaaccgcaac 2160
cagggcaacg ccaccggcgg tagaacccag cctcagaata gaacagtgaa caccgtgcgg 2220
gtgacccaga ccaatcctca aggcggctcc tccgtgtcca acccagctgt gacaacttct 2280
cagaatacag gaacaggaag tgcaactcag agctcatcat cttaaaggct ttgtggacac 2340
aggcagcagc atcacctgct tccccaagta caccctggtc gaggaagatc ctatcggcca 2400
gtacgacatc agcaccatcc acggcacagt gtcccagcct gtgtactaca tcaagttcaa 2460
ggtgaacggc aagaaagtgg aagccgaggt gaccgagtct ccactggact acgtgatcct 2520
gtgtcctagc gacgtgccct ggctgtctac aaagctggaa ctgacaatta agctgcctct 2580
gcaccagcag caacaggagc tgctgagcaa gaccagagtg aatcaaaaac agctgcagaa 2640
actctttatc cagtatgatg acctgtggca gaagtgggag aaccaggttg gacaccggaa 2700
gggtgccaga acagtgaaca ccgtgcgggt gggcggcagc ccaaagaaga agcggaaggt 2760
ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2820
cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2880
tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2940
cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 3000
agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 3060
agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 3120
gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 3180
gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 3240
taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 3300
tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3360
catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3420
tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3480
cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3540
ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3600
cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3660
cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3720
cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3780
ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3840
gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3900
gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3960
gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 4020
cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 4080
ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 4140
agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 4200
atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 4260
ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 4320
ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4380
cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4440
cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4500
ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4560
gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4620
gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4680
cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4740
ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4800
gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4860
caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4920
atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4980
cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 5040
gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 5100
aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 5160
caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 5220
cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 5280
catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 5340
gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5400
caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5460
gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5520
acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5580
agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5640
ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5700
tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5760
ttga 5764
<210> 898
<211> 5404
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP56 plasmid Sequence
<400> 898
atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60
ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120
accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180
gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240
cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300
gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360
gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420
gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480
ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540
atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600
agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660
cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720
tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780
gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840
gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900
gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960
ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020
gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080
ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140
cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200
caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260
ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320
cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380
aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440
acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500
cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560
ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620
ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680
accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740
gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800
ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860
aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920
gcttccagcg gagatcaaag gaactaaact gttagcccat tgggacagcg gcgccaccat 1980
tacatgcgtg cccgagtcct tcctggaaga tgagcagcct atcaaacaga ccctgatcaa 2040
gacaatccac ggcgagaagc agcagaaagt gtactacctg acctttaaga tcaagggaag 2100
aaaggtggaa gctgaagtga tcgccagccc ttacgagtac atcctgctgt ctccaacaga 2160
cgtgccttgg ctgacacagc aacctctgca gctgaccatc ctggtccccc tgcaggagta 2220
tcaggataga atcctcaaca agaccgccct gcctgaggaa cagaagcaaa gactgaagac 2280
cctgttcgcc aagtacgaca ccctgtggca gcactgggag aaccaggtgg gccaccggcg 2340
gggtgccaga gccgtcaaca cagtgaccca gggcggcagc ccaaagaaga agcggaaggt 2400
ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2460
cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2520
tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2580
cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 2640
agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 2700
agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 2760
gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 2820
gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 2880
taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 2940
tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3000
catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3060
tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3120
cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3180
ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3240
cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3300
cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3360
cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3420
ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3480
gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3540
gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3600
gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 3660
cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 3720
ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 3780
agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 3840
atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 3900
ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 3960
ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4020
cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4080
cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4140
ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4200
gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4260
gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4320
cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4380
ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4440
gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4500
caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4560
atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4620
cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 4680
gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 4740
aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 4800
caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 4860
cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 4920
catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 4980
gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5040
caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5100
gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5160
acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5220
agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5280
ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5340
tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5400
ttga 5404
<210> 899
<211> 5140
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP57 plasmid sequence
<400> 899
atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60
atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120
gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180
cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240
tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300
cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360
cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420
gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480
atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540
cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600
cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660
cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720
tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780
gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840
tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900
ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960
ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020
cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080
gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140
ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200
gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260
agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320
cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380
agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440
tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500
caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560
agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620
ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa 1680
gggattttat gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga 1740
agagcctatc ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta 1800
ctacctgacc tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct 1860
ggactacgtg atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact 1920
gacaattaaa atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc 1980
tagcgaggga aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa 2040
gtgggaaaac caggtcggcc acagaagagg tgccaacacc gtgcacaccg tgcggcaagt 2100
ggaatctggc ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat 2160
caacaagatc agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg 2220
ccccatgaaa accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa 2280
cctgagaaag aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct 2340
gaacaagctg ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga 2400
agagttccag aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa 2460
gatcgaccag aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg 2520
ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga 2580
gaaaggcaag gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct 2640
gattctgctg gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct 2700
gggcaagttt ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac 2760
acaccccgtg aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg 2820
caaagccctg tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga 2880
catcatcatc gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag 2940
ggagctggcc ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca 3000
cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa 3060
cctgaacctg tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact 3120
gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga 3180
catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg 3240
gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga 3300
ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct 3360
ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga 3420
caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga 3480
cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga 3540
gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg 3600
gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat 3660
cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa 3720
actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat 3780
caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga 3840
gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct 3900
ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac 3960
cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac 4020
cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga 4080
cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc 4140
tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg 4200
caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca 4260
ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa 4320
ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc 4380
cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg 4440
caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa 4500
actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc 4560
caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga 4620
aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt 4680
tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag 4740
cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa 4800
gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca 4860
agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct 4920
gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa 4980
caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag 5040
aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt 5100
agccctcgag tacccatatg atgtccctga ctacgcttga 5140
<210> 900
<211> 4996
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP58 plasmid sequence
<400> 900
atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60
cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120
ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180
gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240
ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300
cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360
cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420
gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480
atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540
ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600
agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660
gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720
agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780
gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840
ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900
ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960
attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020
aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080
cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140
aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200
gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260
aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320
ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380
ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440
ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500
tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag attaaaggtt actgggattc 1560
tcaggccgac atcacctgcg tgccaaagga cctgctgcag ggcgaggaac ccgtgcggca 1620
gcagaatgtg accaccatcc acggcaccca ggagggcgat gtctactacg tgaacctgaa 1680
gatcgacggc agaagaatca acaccgaggt gatcggcaca acactggact atgctatcat 1740
cacccctggc gacgtgcctt ggatcctgaa gaaacctctg gaactgacaa ttaagctgga 1800
tctggaagag caacaaggaa ccctgctcaa caacagcatc ctgagcaaga agggcaagga 1860
agagctgaaa cagctgttcg agaagtactc cgccctgtgg cagagctggg agaaccaggt 1920
gggacacaga cggggtgccg ccgccgtgca caccgtgaaa gccggcggca gcccaaagaa 1980
gaagcggaag gtctctagac aagagatcaa gagaatcaac aagatcagaa ggagactggt 2040
caaggacagc aacacaaaga aggccggcaa gacaggcccc atgaaaaccc tgctcgtcag 2100
agtgatgacc cctgacctga gagagcggct ggaaaacctg agaaagaagc ccgagaacat 2160
ccctcagcct atcagcaaca ccagcagggc caacctgaac aagctgctga ccgactacac 2220
cgagatgaag aaagccatcc tgcacgtgta ctgggaagag ttccagaaag accccgtggg 2280
cctgatgagc agagttgctc agcctgccag caagaagatc gaccagaaca agctgaagcc 2340
cgagatggac gagaagggca atctgaccac agccggcttt gcctgctctc agtgtggcca 2400
gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa ggcaaggcct acaccaacta 2460
cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt ctgctggccc agctgaaacc 2520
tgagaaggac tctgatgagg ccgtgaccta cagcctgggc aagtttggac agagagccct 2580
ggacttctac agcatccacg tgaccaaaga aagcacacac cccgtgaagc ccctggctca 2640
gatcgccggc aatagatacg cctctggacc tgtgggcaaa gccctgtccg atgcctgcat 2700
gggaacaatc gccagcttcc tgagcaagta ccaggacatc atcatcgagc accagaaggt 2760
ggtcaagggc aaccagaaga gactggaaag cctgagggag ctggccggca aagagaacct 2820
ggaatacccc agcgtgaccc tgcctcctca gcctcacaca aaagaaggcg tggacgccta 2880
caacgaagtg atcgccagag tgagaatgtg ggtcaacctg aacctgtggc agaagctgaa 2940
actgtccagg gacgacgcca agcctctgct gagactgaag ggcttcccta gcttccctct 3000
ggtggaaaga caggccaatg aagtggattg gtgggacatg gtctgcaacg tgaagaagct 3060
gatcaacgag aagaaagagg atggcaaggt tttctggcag aacctggccg gctacaagag 3120
acaagaagcc ctgaggcctt acctgagcag cgaagaggac cggaagaagg gcaagaagtt 3180
cgccagatac cagctgggcg acctgctgct gcacctggaa aagaagcacg gcgaggactg 3240
gggcaaagtg tacgatgagg cctgggagag aatcgacaag aaggtggaag gcctgagcaa 3300
gcacattaag ctggaagagg aaagaaggag cgaggacgcc caatctaaag ccgctctgac 3360
cgattggctg agagccaagg ccagctttgt gatcgagggc ctgaaagagg ccgacaagga 3420
cgagttctgc agatgcgagc tgaagctgca gaagtggtac ggcgatctga gaggcaagcc 3480
cttcgccatt gaggccgaga acagcatcct ggacatcagc ggcttcagca agcagtacaa 3540
ctgcgccttc atttggcaga aagacggcgt caagaaactg aacctgtacc tgatcatcaa 3600
ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa cccgaggcct tcgaggctaa 3660
cagattctac accgtgatca acaaaaagtc cggcgagatc gtgcccatgg aagtgaactt 3720
caacttcgac gaccccaacc tgattatcct gcctctggcc ttcggcaaga gacagggcag 3780
agagttcatc tggaacgatc tgctgagcct ggaaaccggc tctctgaagc tggccaatgg 3840
cagagtgatc gagaaaaccc tgtacaacag gagaaccaga caggacgagc ctgctctgtt 3900
tgtggccctg accttcgaga gaagagaggt gctggacagc agcaacatca agcccatgaa 3960
cctgatcggc gtggaccggg gcgagaatat ccctgctgtg atcgccctga cagaccctga 4020
aggatgccca ctgagcagat tcaaggactc cctgggcaac cctacacaca tcctgagaat 4080
cggcgagagc tacaaagaga agcagaggac aatccaggcc aagaaagagg tggaacagag 4140
aagagccggc ggatactcta ggaagtacgc cagcaaggcc aagaatctgg ccgacgacat 4200
ggtccgaaac accgccagag atctgctgta ctacgccgtg acacaggacg ccatgctgat 4260
cttcgagaat ctgagcagag gcttcggccg gcagggcaag agaaccttta tggccgagag 4320
gcagtacacc agaatggaag attggctcac agctaaactg gcctacgagg gactgagcaa 4380
gacctacctg tccaaaacac tggcccagta tacctccaag acctgcagca attgcggctt 4440
caccatcacc agcgccgact acgacagagt gctggaaaag ctcaagaaaa ccgccaccgg 4500
ctggatgacc accatcaacg gcaaagagct gaaggttgag ggccagatca cctactacaa 4560
caggtacaag aggcagaacg tcgtgaagga tctgagcgtg gaactggaca gactgagcga 4620
agagagcgtg aacaacgaca tcagcagctg gacaaagggc agatcaggcg aggctctgag 4680
cctgctgaag aagaggttta gccacagacc tgtgcaagag aagttcgtgt gcctgaactg 4740
cggcttcgag acacacgccg atgaacaggc tgccctgaac attgccagaa gctggctgtt 4800
cctgagaagc caagagtaca agaagtacca gaccaacaag accaccggca acaccgacaa 4860
gagggccttt gtggaaacct ggcagagctt ctacagaaaa aagctgaaag aagtctggaa 4920
gcccgccgtg actagtccaa aaaagaagag aaaggtagcc ctcgagtacc catatgatgt 4980
ccctgactac gcttga 4996
<210> 901
<211> 5401
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP59 plasmid sequence
<400> 901
atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60
ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120
tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180
cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240
accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300
gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360
ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420
aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480
gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540
gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600
ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660
tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720
aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780
cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840
cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900
agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960
aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020
atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080
tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140
ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200
ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260
cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320
gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380
gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440
gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500
ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560
agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620
agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680
cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740
agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800
aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860
gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gacagcggag ccaccattac 1980
atgcatcccc gaggcttttc tggaagatga gcagcctatc caaacaatgc tgatcaagac 2040
catccacggc gagaagcagc agaacgtgta ctacctgaca ttcaagatcc agggcagaaa 2100
ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaatc cttctgatgt 2160
gccatggctg atgaaaaagc ctctgcaact gaccgtgctg gtccccctgc aggactacca 2220
ggagcggctg ctgaaacaga ccaccctgcc taaggaacag aaggaccagc tggaaaagct 2280
gttcctgaag tacgacgccc tgtggcagca ctgggagaac caggtgggcc acagaagagg 2340
tgccagaaca gtgaacaccg tgacaaccgg cggcagccca aagaagaagc ggaaggtctc 2400
tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460
aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520
cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580
caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640
catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700
tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760
gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820
caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880
cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940
tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000
ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060
atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120
cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180
gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240
gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300
cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360
cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420
caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480
agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540
gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600
gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660
tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720
agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780
caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840
cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900
cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960
gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020
caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080
gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140
caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200
cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260
aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320
cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380
ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440
cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500
agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560
ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620
cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680
cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740
ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800
aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860
cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920
caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980
gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040
cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100
gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160
cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220
gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280
aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340
tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400
a 5401
<210> 902
<211> 5401
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP60 plasmid sequence
<400> 902
atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60
ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120
tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180
cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240
accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300
ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360
ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420
gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480
gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540
gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600
ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660
tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720
aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780
cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840
cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900
agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960
aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020
atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080
tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140
ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200
ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260
cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320
gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380
gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440
ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500
caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560
ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620
cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680
cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740
cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800
aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860
accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gatagcggag ctacaatcac 1980
ctgcgtgccc gaggcctttc tggaagatga gagacctatc cagaccatgc tgatcaagac 2040
catccacggc gagaagcagc aggacgtcta ctacctgacc ttcaaggtgc agggcagaaa 2100
ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaacc ccagcgacgt 2160
gccttggctg atgaaaaagc ctctgcagct gacagtgctg gtgccactgc acgagtacca 2220
ggagcggctg ctgcaacaaa ccgccctgcc taaggaacag aaagagctgc tgcagaagct 2280
gttcctgaag tacgacgccc tgtggcagca ttgggaaaac caggtgggcc accggagagg 2340
tgccagatcc gtgaacaccg tgacagccgg cggcagccca aagaagaagc ggaaggtctc 2400
tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460
aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520
cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580
caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640
catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700
tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760
gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820
caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880
cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940
tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000
ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060
atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120
cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180
gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240
gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300
cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360
cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420
caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480
agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540
gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600
gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660
tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720
agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780
caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840
cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900
cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960
gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020
caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080
gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140
caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200
cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260
aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320
cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380
ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440
cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500
agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560
ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620
cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680
cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740
ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800
aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860
cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920
caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980
gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040
cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100
gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160
cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220
gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280
aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340
tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400
a 5401
<210> 903
<211> 5811
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP61 plasmid sequence
<400> 903
atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60
acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120
acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180
gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240
tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300
gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360
acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420
agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480
ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540
gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600
cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660
ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720
ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780
cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840
aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900
gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960
gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020
ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080
gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140
tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200
acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260
gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320
ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380
agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440
aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500
aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560
caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620
aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680
aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740
tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800
ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860
cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920
aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc ctgaaatggg 1980
gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040
cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100
tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160
tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220
acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccaacc 2280
tattacttgt caaaaacctt ccttaacatt atggttagat gacaaaatgt tcacaggctt 2340
aatagatacg ggggctgatg tcacaattat caagctggag gactggcctc ctaattggcc 2400
tataacagat accttaacca atttaagagg aataggacaa agtaacaacc ctaaacaaag 2460
ttctaaatat cttacttgga gagataaaga aaacaattct ggtctcatca aaccgtttgt 2520
tattcctaac ttacctgtca atctttgggg ccgagattta ctttctcaaa tgaaaattat 2580
gatgtgtagc cccaatgaca tagtaactgc tcaaatgtta gcccagggct acagcccagg 2640
aaaagggtta ggaaaaaagg aaaatggcat tctacatcct atcccaaatc aaggacaatc 2700
taacaaaaaa ggttttggaa atttttaact gcggccattg acatacttgg tgccccacag 2760
gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820
atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880
ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940
cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000
agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060
gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120
gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180
accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240
caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300
cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360
acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420
aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480
ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540
aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600
gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660
cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720
atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780
ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840
gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900
aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960
agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020
ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080
gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140
aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200
tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260
ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320
atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380
ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440
ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500
aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560
atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620
agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680
aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740
gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800
aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860
gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920
aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980
tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040
ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100
ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160
ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220
cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280
agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340
gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400
aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460
agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520
agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580
caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640
taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700
agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760
aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811
<210> 904
<211> 5077
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP62 plasmid sequence
<400> 904
atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60
gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120
tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180
tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240
aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300
ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360
tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420
aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480
gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540
actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600
catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660
aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720
cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780
ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840
ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900
tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960
actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020
accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080
gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140
cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggaggtttaa cctccccccc cacattacag caagtctttc 1320
ttaaccaaga cccagcatct attctgccag ttataccgtt agatcccgcc cgtcggcccg 1380
taattaaagc ccaggttgac acccagacca gccacccaaa gactatcgaa gctctactag 1440
atacaggagc agacatgaca gtccttccga tagccttgtt ctcaagtaat actcccctca 1500
aaaatacatc cgtattaggg gcagggggcc aaacccaaga tcactttaag ctcacctccc 1560
ttcctgtgct aatacgcctc cctttccgga caacgcctat tgttttaaca tcttgcctag 1620
ttgataccaa aaacaactgg gccatcatag gtcgcgatgc cttacaacaa tgccagggcg 1680
tcctgtacct ccctgaggca aaagggccgc ctgtaatctt gccaatacag gcgccagccg 1740
tccttggact agaacacctc ccaaggcccc cccaaatcag ccagttccct ttaaaccaga 1800
acgcctccag gccttgcaac acttggtccg gaaggccctg gaggcaggcc atatcgaatc 1860
ctacaccggg ccaggaaata acccagtatt cccagttaaa aaggccaatg gaacctggcg 1920
attcatccac gacctgcggg ccactaactc tctaaccata gacctctcat catcttcccc 1980
cgggccccct gacttgtcca gcctgccaac cacacgtgcc cctcaagtgc tgccagtgat 2040
gcacggcggc agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa 2100
caagatcaga aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc 2160
catgaaaacc ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct 2220
gagaaagaag cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa 2280
caagctgctg accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga 2340
gttccagaaa gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat 2400
cgaccagaac aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt 2460
tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa 2520
aggcaaggcc tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat 2580
tctgctggcc cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg 2640
caagtttgga cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca 2700
ccccgtgaag cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa 2760
agccctgtcc gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat 2820
catcatcgag caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga 2880
gctggccggc aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac 2940
aaaagaaggc gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct 3000
gaacctgtgg cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa 3060
gggcttccct agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat 3120
ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca 3180
gaacctggcc ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga 3240
ccggaagaag ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga 3300
aaagaagcac ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa 3360
gaaggtggaa ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc 3420
ccaatctaaa gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg 3480
cctgaaagag gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta 3540
cggcgatctg agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag 3600
cggcttcagc aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact 3660
gaacctgtac ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa 3720
acccgaggcc ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat 3780
cgtgcccatg gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc 3840
cttcggcaag agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg 3900
ctctctgaag ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag 3960
acaggacgag cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag 4020
cagcaacatc aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt 4080
gatcgccctg acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa 4140
ccctacacac atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc 4200
caagaaagag gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc 4260
caagaatctg gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt 4320
gacacaggac gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa 4380
gagaaccttt atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact 4440
ggcctacgag ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa 4500
gacctgcagc aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa 4560
gctcaagaaa accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga 4620
gggccagatc acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt 4680
ggaactggac agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg 4740
cagatcaggc gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga 4800
gaagttcgtg tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa 4860
cattgccaga agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa 4920
gaccaccggc aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa 4980
aaagctgaaa gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc 5040
cctcgagtac ccatatgatg tccctgacta cgcttga 5077
<210> 905
<211> 4871
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP63 plasmid sequence
<400> 905
atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60
ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120
ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180
ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240
actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300
aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360
acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420
ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480
gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540
tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600
caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660
ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720
actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780
ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840
ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900
agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960
caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020
atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080
aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140
gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200
ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260
acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320
tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380
gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440
cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500
tctctctttg gagaagacca gtagtcactg cctacattga agaacagccc gtagaagtat 1560
tattagatac aggggctgac gattcaattg tagcagggat agaattgggt ccaaattata 1620
cccctaaaat agtaggagga ataggaggct tcattaacac caaagaatat aaagatgtaa 1680
aaataaaagt cttaggcaag gtaattaagg gaacaattat gacgggagat accccaatta 1740
atatttttgg cagaaatttg ctaacagcta tgggcatgtc tttaaatctc cccatagcta 1800
aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860
ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920
acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980
tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040
agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100
tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160
tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220
tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280
tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340
gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400
aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460
tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520
ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580
caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640
agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700
accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760
aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820
ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880
aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940
acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000
aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060
gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120
aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180
ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240
ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300
tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360
ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420
ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480
tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540
tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600
tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660
tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720
tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780
ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840
tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900
gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960
agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020
ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080
gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140
agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200
acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260
acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320
tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380
tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440
acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500
gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560
tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620
tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680
gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740
cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800
ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860
actacgcttg a 4871
<210> 906
<211> 4805
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP88 plasmid sequence
<400> 906
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800
aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860
gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920
cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980
ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040
agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100
gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160
acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220
tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280
gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340
actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400
acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460
gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520
tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580
gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640
ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700
tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760
gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820
gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880
agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940
ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000
accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060
tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120
agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180
tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240
gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300
ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360
tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420
aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480
acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540
acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600
tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660
tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720
tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780
gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840
cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900
gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960
gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020
acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080
atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140
ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200
tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260
ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320
ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380
agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440
tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500
agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560
agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620
gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680
ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740
tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800
acgct 4805
<210> 907
<211> 2413
<212> DNA
<213> Artificial Sequence
<220>
<223> pStx42.174.12.7 plasmid sequence
<400> 907
gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120
atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180
attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240
gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300
agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360
aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420
cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480
cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540
actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600
cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660
ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720
ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780
gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840
gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900
ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960
cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020
caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080
taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800
ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860
gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920
agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980
aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040
tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100
gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280
acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340
gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400
tttttttgaa ttc 2413
<210> 908
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 plasmid sequence
<400> 908
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 909
<211> 4530
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP64 plasmid sequence
<400> 909
atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60
ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120
agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180
agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240
ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300
ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360
cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420
ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480
atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540
tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660
gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720
gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780
ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840
gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960
gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020
aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080
gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140
gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200
gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260
cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320
cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380
gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440
agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggc 1500
ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 1560
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 1620
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 1680
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 1740
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 1800
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 1860
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 1920
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 1980
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 2040
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 2100
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2160
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2220
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2280
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2340
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2400
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2460
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 2520
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 2580
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 2640
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 2700
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 2760
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 2820
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 2880
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 2940
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 3000
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 3060
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3120
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3180
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3240
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3300
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3360
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3420
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3480
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 3540
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 3600
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 3660
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 3720
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 3780
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 3840
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 3900
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 3960
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 4020
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 4080
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4140
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4200
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4260
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4320
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4380
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4440
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4500
tacccatatg atgtccctga ctacgcttga 4530
<210> 910
<211> 4527
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP65 plasmid sequence
<400> 910
atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60
ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120
agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180
cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240
ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300
ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360
agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420
cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480
attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540
tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660
gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720
gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780
ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840
gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960
gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020
aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080
gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140
gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200
gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260
cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320
caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380
gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440
tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagggcggc 1500
agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1560
aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1620
ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1680
cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1740
accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 1800
gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 1860
aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 1920
cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 1980
tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2040
cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2100
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2160
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2220
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2280
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2340
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2400
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2460
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2520
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2580
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2640
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2700
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 2760
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 2820
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 2880
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 2940
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3000
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3060
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3120
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3180
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3240
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3300
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3360
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3420
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3480
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3540
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3600
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3660
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3720
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 3780
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 3840
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 3900
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 3960
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4020
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4080
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4140
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4200
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4260
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4320
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4380
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4440
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4500
ccatatgatg tccctgacta cgcttga 4527
<210> 911
<211> 4497
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP66 plasmid sequence
<400> 911
atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60
agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120
tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180
cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240
ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300
aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360
gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420
ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480
tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540
ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600
aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660
gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720
agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780
gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840
atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900
ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960
ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020
aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080
gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140
agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200
cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260
aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320
gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380
tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440
gctctgcagg gcaaaagcat caagggcggc agcccaaaga agaagcggaa ggtctctaga 1500
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 1560
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 1620
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 1680
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 1740
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 1800
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 1860
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 1920
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 1980
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2040
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2100
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2160
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2220
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2280
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2340
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2400
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2460
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 2520
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 2580
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 2640
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 2700
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 2760
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 2820
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 2880
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 2940
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3000
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3060
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3120
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3180
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3240
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3300
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3360
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3420
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3480
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 3540
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 3600
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 3660
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 3720
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 3780
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 3840
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 3900
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 3960
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4020
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4080
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4140
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4200
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4260
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4320
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4380
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4440
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4497
<210> 912
<211> 4551
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP67 plasmid sequence
<400> 912
atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60
tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120
aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180
ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240
tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300
agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360
agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420
accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480
gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540
gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600
aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660
cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720
gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780
gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840
gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900
cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960
tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020
gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080
aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140
tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200
gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260
ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320
atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380
tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440
agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500
agaggacaaa agtacagcgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 1560
atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 1620
ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 1680
cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 1740
agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 1800
gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 1860
gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 1920
accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 1980
caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 2040
cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 2100
acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 2160
aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 2220
ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 2280
aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 2340
gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 2400
cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 2460
atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 2520
ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 2580
gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 2640
aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 2700
agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 2760
ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 2820
gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 2880
aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 2940
tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 3000
ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 3060
atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 3120
ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 3180
ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 3240
aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 3300
atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 3360
agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 3420
aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 3480
gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 3540
aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 3600
gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 3660
aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 3720
tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 3780
ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 3840
ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 3900
ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 3960
cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 4020
agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 4080
gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 4140
aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 4200
agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 4260
agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 4320
caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 4380
taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 4440
agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 4500
aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 4551
<210> 913
<211> 4638
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP68 plasmid sequence
<400> 913
atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60
acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120
acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180
gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240
agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300
gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360
accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420
tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480
ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540
gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600
agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660
cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720
ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780
caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840
aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900
gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960
gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020
ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080
gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140
tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200
accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260
gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320
ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380
agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440
aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500
aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560
cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaagggcgg cagcccaaag 1620
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1680
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1740
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1800
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1860
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1920
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1980
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2040
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2100
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2160
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2220
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2280
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2340
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2400
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2460
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2520
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2580
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2640
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2700
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2760
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2820
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2880
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2940
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3000
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3060
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3120
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3180
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3240
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3300
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3360
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3420
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3480
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3540
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3600
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3660
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3720
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3780
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3840
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3900
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3960
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4020
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4080
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4140
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4200
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4260
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4320
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4380
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4440
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4500
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4560
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4620
gtccctgact acgcttga 4638
<210> 914
<211> 4029
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP69 plasmid sequence
<400> 914
atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60
ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120
aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180
ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240
aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300
ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360
agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420
ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480
gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540
acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600
cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660
cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720
ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780
cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840
ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900
aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960
gccctgctgg tgcacacccc aggaccaaag atgcctggcg gcagcccaaa gaagaagcgg 1020
aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1080
agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1140
acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1200
cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1260
aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1320
agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1380
gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1440
ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 1500
agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 1560
gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 1620
tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 1680
ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 1740
atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 1800
ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 1860
cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 1920
gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 1980
agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2040
agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2100
gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2160
gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2220
taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2280
gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2340
aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2400
ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 2460
tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 2520
attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 2580
ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 2640
aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 2700
tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 2760
gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 2820
atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 2880
atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 2940
ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3000
ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3060
ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3120
agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3180
ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3240
aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3300
aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3360
accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3420
ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 3480
accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 3540
accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 3600
aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 3660
gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 3720
aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 3780
gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 3840
agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 3900
tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 3960
gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4020
tacgcttga 4029
<210> 915
<211> 4095
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP70 plasmid sequence
<400> 915
atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60
gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120
tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180
tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240
aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300
cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360
tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420
aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480
gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540
acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600
caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660
aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720
agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780
ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840
ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900
tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960
accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020
accaaggtgc tggtggtgca gcctaagaag cctcccccta atggcggcag cccaaagaag 1080
aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 1140
aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 1200
gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 1260
cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 1320
gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 1380
ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 1440
gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 1500
cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 1560
ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 1620
gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 1680
gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 1740
atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 1800
ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 1860
gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 1920
gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 1980
aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2040
ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 2100
gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 2160
atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 2220
caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 2280
gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 2340
ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 2400
cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 2460
gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 2520
gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 2580
ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 2640
tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 2700
tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 2760
agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 2820
aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 2880
gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 2940
agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3000
gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3060
ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 3120
ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 3180
ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 3240
agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 3300
gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 3360
ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 3420
cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 3480
acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 3540
accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 3600
tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 3660
aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 3720
gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 3780
ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 3840
ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 3900
ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 3960
agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4020
cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4080
cctgactacg cttga 4095
<210> 916
<211> 4434
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP71 plasmid sequence
<400> 916
atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60
accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120
aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180
gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240
cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300
aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360
acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420
aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480
ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540
aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600
gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660
aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720
aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780
ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840
aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900
atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960
acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020
aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080
accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140
gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200
aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260
gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320
cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380
gcccagacaa tgaacggcaa tggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1440
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1500
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1560
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1620
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 1680
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 1740
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 1800
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 1860
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 1920
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 1980
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2040
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2100
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2160
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2220
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2280
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2340
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2400
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2460
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2520
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2580
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 2640
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 2700
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 2760
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 2820
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 2880
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 2940
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3000
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3060
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3120
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3180
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3240
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3300
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3360
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3420
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3480
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3540
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3600
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 3660
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 3720
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 3780
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 3840
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 3900
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 3960
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4020
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4080
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4140
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4200
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4260
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4320
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4380
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4434
<210> 917
<211> 4398
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP72 plasmid sequence
<400> 917
atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60
gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120
gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180
atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240
ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300
ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360
cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420
ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480
cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540
tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600
gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660
aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720
atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780
accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840
ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900
tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960
gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020
cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080
tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140
taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200
acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260
gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320
atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaaggcgg cagcccaaag 1380
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1440
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1500
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1560
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1620
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1680
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1740
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1800
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1860
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1920
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1980
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2040
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2100
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2160
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2220
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2280
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2340
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2400
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2460
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2520
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2580
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2640
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2700
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2760
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2820
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2880
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2940
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3000
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3060
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3120
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3180
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3240
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3300
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3360
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3420
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3480
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3540
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3600
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3660
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3720
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3780
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3840
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3900
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3960
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4020
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4080
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4140
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4200
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4260
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4320
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4380
gtccctgact acgcttga 4398
<210> 918
<211> 4497
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP73 plasmid sequence
<400> 918
atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60
cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120
gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180
atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240
ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300
gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360
cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420
aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480
gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540
gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600
aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660
ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720
aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780
atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840
gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900
cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960
tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020
ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080
cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140
ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200
tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260
ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320
gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380
cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440
gtggtgtccg gacagaagca ggacggcggc agcccaaaga agaagcggaa ggtctctaga 1500
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 1560
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 1620
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 1680
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 1740
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 1800
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 1860
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 1920
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 1980
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2040
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2100
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2160
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2220
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2280
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2340
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2400
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2460
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 2520
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 2580
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 2640
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 2700
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 2760
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 2820
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 2880
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 2940
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3000
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3060
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3120
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3180
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3240
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3300
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3360
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3420
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3480
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 3540
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 3600
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 3660
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 3720
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 3780
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 3840
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 3900
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 3960
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4020
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4080
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4140
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4200
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4260
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4320
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4380
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4440
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4497
<210> 919
<211> 4158
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP74 plasmid sequence
<400> 919
atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60
gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120
ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180
aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240
acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300
atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360
atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420
agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480
gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540
gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600
gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720
cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780
agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840
aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900
gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960
aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020
ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080
ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggggcgg cagcccaaag 1140
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1200
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1260
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1320
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1380
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1440
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1500
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1560
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1620
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1680
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1740
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 1800
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 1860
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 1920
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 1980
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2040
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2100
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2160
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2220
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2280
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2340
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2400
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2460
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2520
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2580
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2640
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2700
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 2760
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 2820
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 2880
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 2940
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3000
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3060
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3120
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3180
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3240
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3300
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3360
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3420
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3480
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3540
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3600
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3660
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3720
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 3780
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 3840
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 3900
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 3960
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4020
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4080
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4140
gtccctgact acgcttga 4158
<210> 920
<211> 4140
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP75 plasmid sequence
<400> 920
atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60
ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120
cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180
gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240
gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300
tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360
agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420
cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480
tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540
ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600
atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660
cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720
cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780
atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840
gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900
caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960
gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020
gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080
acaggcctgg ccggaccatt caagggaggc ggcagcccaa agaagaagcg gaaggtctct 1140
agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1200
aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1260
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1320
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1380
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1440
gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1500
ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1560
aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 1620
gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 1680
gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 1740
cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 1800
tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 1860
ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 1920
aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 1980
accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2040
agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2100
gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2160
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2220
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2280
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2340
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2400
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2460
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2520
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 2580
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 2640
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 2700
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 2760
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 2820
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 2880
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 2940
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3000
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3060
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3120
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3180
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3240
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3300
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3360
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3420
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3480
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3540
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 3600
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 3660
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 3720
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 3780
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 3840
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 3900
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 3960
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4020
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4080
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttga 4140
<210> 921
<211> 4158
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP76 plasmid sequence
<400> 921
atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60
ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120
ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180
ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240
acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300
aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360
accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420
ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480
gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540
tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600
cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660
ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720
acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780
ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840
ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900
agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960
cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020
atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080
aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctggcgg cagcccaaag 1140
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1200
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1260
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1320
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1380
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1440
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1500
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1560
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1620
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1680
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1740
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 1800
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 1860
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 1920
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 1980
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2040
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2100
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2160
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2220
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2280
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2340
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2400
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2460
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2520
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2580
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2640
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2700
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 2760
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 2820
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 2880
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 2940
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3000
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3060
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3120
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3180
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3240
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3300
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3360
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3420
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3480
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3540
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3600
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3660
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3720
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 3780
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 3840
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 3900
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 3960
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4020
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4080
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4140
gtccctgact acgcttga 4158
<210> 922
<211> 4152
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP77 plasmid sequence
<400> 922
atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60
gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120
tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180
acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240
agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300
aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360
aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420
gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480
gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540
gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600
gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720
atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780
atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840
ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900
ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960
accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020
acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080
gagggcttta agatgcagct gctggcccag gccctgagag gcggcagccc aaagaagaag 1140
cggaaggtct ctagacaaga gatcaagaga atcaacaaga tcagaaggag actggtcaag 1200
gacagcaaca caaagaaggc cggcaagaca ggccccatga aaaccctgct cgtcagagtg 1260
atgacccctg acctgagaga gcggctggaa aacctgagaa agaagcccga gaacatccct 1320
cagcctatca gcaacaccag cagggccaac ctgaacaagc tgctgaccga ctacaccgag 1380
atgaagaaag ccatcctgca cgtgtactgg gaagagttcc agaaagaccc cgtgggcctg 1440
atgagcagag ttgctcagcc tgccagcaag aagatcgacc agaacaagct gaagcccgag 1500
atggacgaga agggcaatct gaccacagcc ggctttgcct gctctcagtg tggccagcct 1560
ctgttcgtgt acaagctgga acaggtgtcc gagaaaggca aggcctacac caactacttc 1620
ggcagatgta acgtggccga gcacgagaag ctgattctgc tggcccagct gaaacctgag 1680
aaggactctg atgaggccgt gacctacagc ctgggcaagt ttggacagag agccctggac 1740
ttctacagca tccacgtgac caaagaaagc acacaccccg tgaagcccct ggctcagatc 1800
gccggcaata gatacgcctc tggacctgtg ggcaaagccc tgtccgatgc ctgcatggga 1860
acaatcgcca gcttcctgag caagtaccag gacatcatca tcgagcacca gaaggtggtc 1920
aagggcaacc agaagagact ggaaagcctg agggagctgg ccggcaaaga gaacctggaa 1980
taccccagcg tgaccctgcc tcctcagcct cacacaaaag aaggcgtgga cgcctacaac 2040
gaagtgatcg ccagagtgag aatgtgggtc aacctgaacc tgtggcagaa gctgaaactg 2100
tccagggacg acgccaagcc tctgctgaga ctgaagggct tccctagctt ccctctggtg 2160
gaaagacagg ccaatgaagt ggattggtgg gacatggtct gcaacgtgaa gaagctgatc 2220
aacgagaaga aagaggatgg caaggttttc tggcagaacc tggccggcta caagagacaa 2280
gaagccctga ggccttacct gagcagcgaa gaggaccgga agaagggcaa gaagttcgcc 2340
agataccagc tgggcgacct gctgctgcac ctggaaaaga agcacggcga ggactggggc 2400
aaagtgtacg atgaggcctg ggagagaatc gacaagaagg tggaaggcct gagcaagcac 2460
attaagctgg aagaggaaag aaggagcgag gacgcccaat ctaaagccgc tctgaccgat 2520
tggctgagag ccaaggccag ctttgtgatc gagggcctga aagaggccga caaggacgag 2580
ttctgcagat gcgagctgaa gctgcagaag tggtacggcg atctgagagg caagcccttc 2640
gccattgagg ccgagaacag catcctggac atcagcggct tcagcaagca gtacaactgc 2700
gccttcattt ggcagaaaga cggcgtcaag aaactgaacc tgtacctgat catcaattac 2760
ttcaaaggcg gcaagctgcg gttcaagaag atcaaacccg aggccttcga ggctaacaga 2820
ttctacaccg tgatcaacaa aaagtccggc gagatcgtgc ccatggaagt gaacttcaac 2880
ttcgacgacc ccaacctgat tatcctgcct ctggccttcg gcaagagaca gggcagagag 2940
ttcatctgga acgatctgct gagcctggaa accggctctc tgaagctggc caatggcaga 3000
gtgatcgaga aaaccctgta caacaggaga accagacagg acgagcctgc tctgtttgtg 3060
gccctgacct tcgagagaag agaggtgctg gacagcagca acatcaagcc catgaacctg 3120
atcggcgtgg accggggcga gaatatccct gctgtgatcg ccctgacaga ccctgaagga 3180
tgcccactga gcagattcaa ggactccctg ggcaacccta cacacatcct gagaatcggc 3240
gagagctaca aagagaagca gaggacaatc caggccaaga aagaggtgga acagagaaga 3300
gccggcggat actctaggaa gtacgccagc aaggccaaga atctggccga cgacatggtc 3360
cgaaacaccg ccagagatct gctgtactac gccgtgacac aggacgccat gctgatcttc 3420
gagaatctga gcagaggctt cggccggcag ggcaagagaa cctttatggc cgagaggcag 3480
tacaccagaa tggaagattg gctcacagct aaactggcct acgagggact gagcaagacc 3540
tacctgtcca aaacactggc ccagtatacc tccaagacct gcagcaattg cggcttcacc 3600
atcaccagcg ccgactacga cagagtgctg gaaaagctca agaaaaccgc caccggctgg 3660
atgaccacca tcaacggcaa agagctgaag gttgagggcc agatcaccta ctacaacagg 3720
tacaagaggc agaacgtcgt gaaggatctg agcgtggaac tggacagact gagcgaagag 3780
agcgtgaaca acgacatcag cagctggaca aagggcagat caggcgaggc tctgagcctg 3840
ctgaagaaga ggtttagcca cagacctgtg caagagaagt tcgtgtgcct gaactgcggc 3900
ttcgagacac acgccgatga acaggctgcc ctgaacattg ccagaagctg gctgttcctg 3960
agaagccaag agtacaagaa gtaccagacc aacaagacca ccggcaacac cgacaagagg 4020
gcctttgtgg aaacctggca gagcttctac agaaaaaagc tgaaagaagt ctggaagccc 4080
gccgtgacta gtccaaaaaa gaagagaaag gtagccctcg agtacccata tgatgtccct 4140
gactacgctt ga 4152
<210> 923
<211> 4638
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP85 plasmid sequence
<400> 923
atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60
acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120
acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180
gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240
tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300
gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360
acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420
agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480
ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540
gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600
cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660
ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720
ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780
cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840
aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900
gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960
gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020
ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080
gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140
tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200
acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260
gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320
ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380
agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440
aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500
aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560
caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaaggcgg cagcccaaag 1620
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1680
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1740
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1800
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1860
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1920
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1980
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2040
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2100
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2160
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2220
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2280
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2340
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2400
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2460
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2520
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2580
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2640
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2700
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2760
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2820
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2880
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2940
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3000
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3060
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3120
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3180
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3240
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3300
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3360
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3420
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3480
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3540
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3600
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3660
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3720
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3780
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3840
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3900
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3960
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4020
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4080
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4140
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4200
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4260
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4320
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4380
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4440
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4500
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4560
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4620
gtccctgact acgcttga 4638
<210> 924
<211> 4095
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP86 plasmid sequence
<400> 924
atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60
gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120
tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180
tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240
aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300
ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360
tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420
aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480
gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540
actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600
catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660
aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720
cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780
ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840
ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900
tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960
actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020
accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atggcggcag cccaaagaag 1080
aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 1140
aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 1200
gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 1260
cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 1320
gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 1380
ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 1440
gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 1500
cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 1560
ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 1620
gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 1680
gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 1740
atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 1800
ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 1860
gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 1920
gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 1980
aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2040
ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 2100
gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 2160
atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 2220
caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 2280
gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 2340
ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 2400
cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 2460
gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 2520
gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 2580
ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 2640
tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 2700
tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 2760
agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 2820
aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 2880
gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 2940
agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3000
gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3060
ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 3120
ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 3180
ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 3240
agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 3300
gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 3360
ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 3420
cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 3480
acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 3540
accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 3600
tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 3660
aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 3720
gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 3780
ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 3840
ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 3900
ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 3960
agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4020
cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4080
cctgactacg cttga 4095
<210> 925
<211> 4158
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP87 plasmid sequence
<400> 925
atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60
ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120
ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180
ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240
actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300
aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360
acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420
ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480
gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540
tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600
caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660
ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720
actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780
ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840
ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900
agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960
caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020
atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080
aaagctaggt taatggcaga agcattgaaa gaggcactga ggccaggcgg cagcccaaag 1140
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1200
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1260
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1320
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1380
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1440
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 1500
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 1560
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 1620
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 1680
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 1740
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 1800
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 1860
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 1920
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 1980
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2040
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2100
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2160
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2220
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2280
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2340
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2400
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 2460
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 2520
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 2580
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 2640
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 2700
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 2760
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 2820
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 2880
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 2940
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3000
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3060
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3120
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3180
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3240
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3300
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3360
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3420
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 3480
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 3540
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 3600
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 3660
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 3720
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 3780
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 3840
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 3900
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 3960
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4020
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4080
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4140
gtccctgact acgcttga 4158
<210> 926
<211> 5140
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP57 plasmid sequence
<400> 926
atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60
atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120
gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180
cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240
tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300
cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360
cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420
gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480
atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540
cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600
cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660
cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720
tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780
gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840
tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900
ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960
ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020
cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080
gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140
ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200
gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260
agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320
cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380
agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440
tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500
caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560
agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620
ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa 1680
gggattttat gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga 1740
agagcctatc ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta 1800
ctacctgacc tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct 1860
ggactacgtg atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact 1920
gacaattaaa atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc 1980
tagcgaggga aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa 2040
gtgggaaaac caggtcggcc acagaagagg tgccaacacc gtgcacaccg tgcggcaagt 2100
ggaatctggc ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat 2160
caacaagatc agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg 2220
ccccatgaaa accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa 2280
cctgagaaag aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct 2340
gaacaagctg ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga 2400
agagttccag aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa 2460
gatcgaccag aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg 2520
ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga 2580
gaaaggcaag gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct 2640
gattctgctg gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct 2700
gggcaagttt ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac 2760
acaccccgtg aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg 2820
caaagccctg tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga 2880
catcatcatc gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag 2940
ggagctggcc ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca 3000
cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa 3060
cctgaacctg tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact 3120
gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga 3180
catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg 3240
gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga 3300
ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct 3360
ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga 3420
caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga 3480
cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga 3540
gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg 3600
gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat 3660
cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa 3720
actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat 3780
caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga 3840
gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct 3900
ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac 3960
cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac 4020
cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga 4080
cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc 4140
tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg 4200
caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca 4260
ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa 4320
ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc 4380
cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg 4440
caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa 4500
actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc 4560
caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga 4620
aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt 4680
tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag 4740
cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa 4800
gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca 4860
agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct 4920
gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa 4980
caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag 5040
aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt 5100
agccctcgag tacccatatg atgtccctga ctacgcttga 5140
<210> 927
<211> 4996
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP58 plasmid sequence
<400> 927
atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60
cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120
ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180
gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240
ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300
cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360
cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420
gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480
atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540
ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600
agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660
gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720
agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780
gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840
ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900
ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960
attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020
aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080
cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140
aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200
gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260
aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320
ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380
ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440
ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500
tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag attaaaggtt actgggattc 1560
tcaggccgac atcacctgcg tgccaaagga cctgctgcag ggcgaggaac ccgtgcggca 1620
gcagaatgtg accaccatcc acggcaccca ggagggcgat gtctactacg tgaacctgaa 1680
gatcgacggc agaagaatca acaccgaggt gatcggcaca acactggact atgctatcat 1740
cacccctggc gacgtgcctt ggatcctgaa gaaacctctg gaactgacaa ttaagctgga 1800
tctggaagag caacaaggaa ccctgctcaa caacagcatc ctgagcaaga agggcaagga 1860
agagctgaaa cagctgttcg agaagtactc cgccctgtgg cagagctggg agaaccaggt 1920
gggacacaga cggggtgccg ccgccgtgca caccgtgaaa gccggcggca gcccaaagaa 1980
gaagcggaag gtctctagac aagagatcaa gagaatcaac aagatcagaa ggagactggt 2040
caaggacagc aacacaaaga aggccggcaa gacaggcccc atgaaaaccc tgctcgtcag 2100
agtgatgacc cctgacctga gagagcggct ggaaaacctg agaaagaagc ccgagaacat 2160
ccctcagcct atcagcaaca ccagcagggc caacctgaac aagctgctga ccgactacac 2220
cgagatgaag aaagccatcc tgcacgtgta ctgggaagag ttccagaaag accccgtggg 2280
cctgatgagc agagttgctc agcctgccag caagaagatc gaccagaaca agctgaagcc 2340
cgagatggac gagaagggca atctgaccac agccggcttt gcctgctctc agtgtggcca 2400
gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa ggcaaggcct acaccaacta 2460
cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt ctgctggccc agctgaaacc 2520
tgagaaggac tctgatgagg ccgtgaccta cagcctgggc aagtttggac agagagccct 2580
ggacttctac agcatccacg tgaccaaaga aagcacacac cccgtgaagc ccctggctca 2640
gatcgccggc aatagatacg cctctggacc tgtgggcaaa gccctgtccg atgcctgcat 2700
gggaacaatc gccagcttcc tgagcaagta ccaggacatc atcatcgagc accagaaggt 2760
ggtcaagggc aaccagaaga gactggaaag cctgagggag ctggccggca aagagaacct 2820
ggaatacccc agcgtgaccc tgcctcctca gcctcacaca aaagaaggcg tggacgccta 2880
caacgaagtg atcgccagag tgagaatgtg ggtcaacctg aacctgtggc agaagctgaa 2940
actgtccagg gacgacgcca agcctctgct gagactgaag ggcttcccta gcttccctct 3000
ggtggaaaga caggccaatg aagtggattg gtgggacatg gtctgcaacg tgaagaagct 3060
gatcaacgag aagaaagagg atggcaaggt tttctggcag aacctggccg gctacaagag 3120
acaagaagcc ctgaggcctt acctgagcag cgaagaggac cggaagaagg gcaagaagtt 3180
cgccagatac cagctgggcg acctgctgct gcacctggaa aagaagcacg gcgaggactg 3240
gggcaaagtg tacgatgagg cctgggagag aatcgacaag aaggtggaag gcctgagcaa 3300
gcacattaag ctggaagagg aaagaaggag cgaggacgcc caatctaaag ccgctctgac 3360
cgattggctg agagccaagg ccagctttgt gatcgagggc ctgaaagagg ccgacaagga 3420
cgagttctgc agatgcgagc tgaagctgca gaagtggtac ggcgatctga gaggcaagcc 3480
cttcgccatt gaggccgaga acagcatcct ggacatcagc ggcttcagca agcagtacaa 3540
ctgcgccttc atttggcaga aagacggcgt caagaaactg aacctgtacc tgatcatcaa 3600
ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa cccgaggcct tcgaggctaa 3660
cagattctac accgtgatca acaaaaagtc cggcgagatc gtgcccatgg aagtgaactt 3720
caacttcgac gaccccaacc tgattatcct gcctctggcc ttcggcaaga gacagggcag 3780
agagttcatc tggaacgatc tgctgagcct ggaaaccggc tctctgaagc tggccaatgg 3840
cagagtgatc gagaaaaccc tgtacaacag gagaaccaga caggacgagc ctgctctgtt 3900
tgtggccctg accttcgaga gaagagaggt gctggacagc agcaacatca agcccatgaa 3960
cctgatcggc gtggaccggg gcgagaatat ccctgctgtg atcgccctga cagaccctga 4020
aggatgccca ctgagcagat tcaaggactc cctgggcaac cctacacaca tcctgagaat 4080
cggcgagagc tacaaagaga agcagaggac aatccaggcc aagaaagagg tggaacagag 4140
aagagccggc ggatactcta ggaagtacgc cagcaaggcc aagaatctgg ccgacgacat 4200
ggtccgaaac accgccagag atctgctgta ctacgccgtg acacaggacg ccatgctgat 4260
cttcgagaat ctgagcagag gcttcggccg gcagggcaag agaaccttta tggccgagag 4320
gcagtacacc agaatggaag attggctcac agctaaactg gcctacgagg gactgagcaa 4380
gacctacctg tccaaaacac tggcccagta tacctccaag acctgcagca attgcggctt 4440
caccatcacc agcgccgact acgacagagt gctggaaaag ctcaagaaaa ccgccaccgg 4500
ctggatgacc accatcaacg gcaaagagct gaaggttgag ggccagatca cctactacaa 4560
caggtacaag aggcagaacg tcgtgaagga tctgagcgtg gaactggaca gactgagcga 4620
agagagcgtg aacaacgaca tcagcagctg gacaaagggc agatcaggcg aggctctgag 4680
cctgctgaag aagaggttta gccacagacc tgtgcaagag aagttcgtgt gcctgaactg 4740
cggcttcgag acacacgccg atgaacaggc tgccctgaac attgccagaa gctggctgtt 4800
cctgagaagc caagagtaca agaagtacca gaccaacaag accaccggca acaccgacaa 4860
gagggccttt gtggaaacct ggcagagctt ctacagaaaa aagctgaaag aagtctggaa 4920
gcccgccgtg actagtccaa aaaagaagag aaaggtagcc ctcgagtacc catatgatgt 4980
ccctgactac gcttga 4996
<210> 928
<211> 5401
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP59 plasmid sequence
<400> 928
atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60
ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120
tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180
cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240
accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300
gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360
ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420
aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480
gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540
gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600
ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660
tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720
aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780
cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840
cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900
agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960
aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020
atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080
tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140
ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200
ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260
cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320
gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380
gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440
gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500
ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560
agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620
agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680
cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740
agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800
aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860
gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gacagcggag ccaccattac 1980
atgcatcccc gaggcttttc tggaagatga gcagcctatc caaacaatgc tgatcaagac 2040
catccacggc gagaagcagc agaacgtgta ctacctgaca ttcaagatcc agggcagaaa 2100
ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaatc cttctgatgt 2160
gccatggctg atgaaaaagc ctctgcaact gaccgtgctg gtccccctgc aggactacca 2220
ggagcggctg ctgaaacaga ccaccctgcc taaggaacag aaggaccagc tggaaaagct 2280
gttcctgaag tacgacgccc tgtggcagca ctgggagaac caggtgggcc acagaagagg 2340
tgccagaaca gtgaacaccg tgacaaccgg cggcagccca aagaagaagc ggaaggtctc 2400
tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460
aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520
cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580
caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640
catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700
tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760
gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820
caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880
cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940
tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000
ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060
atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120
cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180
gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240
gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300
cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360
cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420
caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480
agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540
gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600
gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660
tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720
agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780
caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840
cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900
cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960
gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020
caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080
gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140
caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200
cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260
aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320
cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380
ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440
cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500
agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560
ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620
cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680
cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740
ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800
aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860
cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920
caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980
gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040
cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100
gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160
cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220
gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280
aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340
tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400
a 5401
<210> 929
<211> 5401
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP60 plasmid sequence
<400> 929
atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60
ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120
tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180
cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240
accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300
ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360
ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420
gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480
gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540
gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600
ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660
tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720
aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780
cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840
cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900
agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960
aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020
atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080
tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140
ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200
ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260
cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320
gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380
gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440
ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500
caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560
ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620
cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680
cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740
cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800
aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860
accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gatagcggag ctacaatcac 1980
ctgcgtgccc gaggcctttc tggaagatga gagacctatc cagaccatgc tgatcaagac 2040
catccacggc gagaagcagc aggacgtcta ctacctgacc ttcaaggtgc agggcagaaa 2100
ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaacc ccagcgacgt 2160
gccttggctg atgaaaaagc ctctgcagct gacagtgctg gtgccactgc acgagtacca 2220
ggagcggctg ctgcaacaaa ccgccctgcc taaggaacag aaagagctgc tgcagaagct 2280
gttcctgaag tacgacgccc tgtggcagca ttgggaaaac caggtgggcc accggagagg 2340
tgccagatcc gtgaacaccg tgacagccgg cggcagccca aagaagaagc ggaaggtctc 2400
tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460
aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520
cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580
caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640
catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700
tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760
gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820
caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880
cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940
tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000
ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060
atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120
cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180
gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240
gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300
cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360
cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420
caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480
agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540
gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600
gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660
tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720
agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780
caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840
cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900
cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960
gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020
caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080
gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140
caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200
cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260
aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320
cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380
ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440
cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500
agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560
ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620
cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680
cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740
ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800
aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860
cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920
caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980
gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040
cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100
gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160
cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220
gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280
aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340
tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400
a 5401
<210> 930
<211> 5811
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP61 plasmid sequence
<400> 930
atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60
acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120
acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180
gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240
tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300
gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360
acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420
agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480
ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540
gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600
cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660
ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720
ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780
cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840
aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900
gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960
gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020
ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080
gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140
tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200
acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260
gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320
ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380
agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440
aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500
aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560
caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620
aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680
aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740
tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800
ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860
cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920
aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc ctgaaatggg 1980
gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040
cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100
tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160
tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220
acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccaacc 2280
tattacttgt caaaaacctt ccttaacatt atggttagat gacaaaatgt tcacaggctt 2340
aatagatacg ggggctgatg tcacaattat caagctggag gactggcctc ctaattggcc 2400
tataacagat accttaacca atttaagagg aataggacaa agtaacaacc ctaaacaaag 2460
ttctaaatat cttacttgga gagataaaga aaacaattct ggtctcatca aaccgtttgt 2520
tattcctaac ttacctgtca atctttgggg ccgagattta ctttctcaaa tgaaaattat 2580
gatgtgtagc cccaatgaca tagtaactgc tcaaatgtta gcccagggct acagcccagg 2640
aaaagggtta ggaaaaaagg aaaatggcat tctacatcct atcccaaatc aaggacaatc 2700
taacaaaaaa ggttttggaa atttttaact gcggccattg acatacttgg tgccccacag 2760
gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820
atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880
ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940
cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000
agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060
gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120
gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180
accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240
caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300
cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360
acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420
aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480
ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540
aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600
gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660
cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720
atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780
ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840
gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900
aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960
agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020
ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080
gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140
aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200
tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260
ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320
atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380
ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440
ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500
aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560
atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620
agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680
aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740
gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800
aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860
gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920
aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980
tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040
ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100
ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160
ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220
cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280
agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340
gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400
aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460
agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520
agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580
caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640
taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700
agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760
aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811
<210> 931
<211> 5077
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP62 plasmid sequence
<400> 931
atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60
gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120
tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180
tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240
aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300
ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360
tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420
aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480
gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540
actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600
catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660
aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720
cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780
ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840
ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900
tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960
actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020
accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080
gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140
cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggaggtttaa cctccccccc cacattacag caagtctttc 1320
ttaaccaaga cccagcatct attctgccag ttataccgtt agatcccgcc cgtcggcccg 1380
taattaaagc ccaggttgac acccagacca gccacccaaa gactatcgaa gctctactag 1440
atacaggagc agacatgaca gtccttccga tagccttgtt ctcaagtaat actcccctca 1500
aaaatacatc cgtattaggg gcagggggcc aaacccaaga tcactttaag ctcacctccc 1560
ttcctgtgct aatacgcctc cctttccgga caacgcctat tgttttaaca tcttgcctag 1620
ttgataccaa aaacaactgg gccatcatag gtcgcgatgc cttacaacaa tgccagggcg 1680
tcctgtacct ccctgaggca aaagggccgc ctgtaatctt gccaatacag gcgccagccg 1740
tccttggact agaacacctc ccaaggcccc cccaaatcag ccagttccct ttaaaccaga 1800
acgcctccag gccttgcaac acttggtccg gaaggccctg gaggcaggcc atatcgaatc 1860
ctacaccggg ccaggaaata acccagtatt cccagttaaa aaggccaatg gaacctggcg 1920
attcatccac gacctgcggg ccactaactc tctaaccata gacctctcat catcttcccc 1980
cgggccccct gacttgtcca gcctgccaac cacacgtgcc cctcaagtgc tgccagtgat 2040
gcacggcggc agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa 2100
caagatcaga aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc 2160
catgaaaacc ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct 2220
gagaaagaag cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa 2280
caagctgctg accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga 2340
gttccagaaa gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat 2400
cgaccagaac aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt 2460
tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa 2520
aggcaaggcc tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat 2580
tctgctggcc cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg 2640
caagtttgga cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca 2700
ccccgtgaag cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa 2760
agccctgtcc gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat 2820
catcatcgag caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga 2880
gctggccggc aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac 2940
aaaagaaggc gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct 3000
gaacctgtgg cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa 3060
gggcttccct agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat 3120
ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca 3180
gaacctggcc ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga 3240
ccggaagaag ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga 3300
aaagaagcac ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa 3360
gaaggtggaa ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc 3420
ccaatctaaa gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg 3480
cctgaaagag gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta 3540
cggcgatctg agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag 3600
cggcttcagc aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact 3660
gaacctgtac ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa 3720
acccgaggcc ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat 3780
cgtgcccatg gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc 3840
cttcggcaag agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg 3900
ctctctgaag ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag 3960
acaggacgag cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag 4020
cagcaacatc aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt 4080
gatcgccctg acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa 4140
ccctacacac atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc 4200
caagaaagag gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc 4260
caagaatctg gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt 4320
gacacaggac gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa 4380
gagaaccttt atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact 4440
ggcctacgag ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa 4500
gacctgcagc aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa 4560
gctcaagaaa accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga 4620
gggccagatc acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt 4680
ggaactggac agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg 4740
cagatcaggc gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga 4800
gaagttcgtg tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa 4860
cattgccaga agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa 4920
gaccaccggc aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa 4980
aaagctgaaa gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc 5040
cctcgagtac ccatatgatg tccctgacta cgcttga 5077
<210> 932
<211> 4871
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP63 plasmid sequence
<400> 932
atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60
ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120
ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180
ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240
actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300
aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360
acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420
ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480
gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540
tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600
caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660
ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720
actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780
ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840
ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900
agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960
caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020
atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080
aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140
gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200
ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260
acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320
tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380
gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440
cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500
tctctctttg gagaagacca gtagtcactg cctacattga agaacagccc gtagaagtat 1560
tattagatac aggggctgac gattcaattg tagcagggat agaattgggt ccaaattata 1620
cccctaaaat agtaggagga ataggaggct tcattaacac caaagaatat aaagatgtaa 1680
aaataaaagt cttaggcaag gtaattaagg gaacaattat gacgggagat accccaatta 1740
atatttttgg cagaaatttg ctaacagcta tgggcatgtc tttaaatctc cccatagcta 1800
aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860
ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920
acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980
tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040
agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100
tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160
tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220
tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280
tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340
gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400
aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460
tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520
ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580
caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640
agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700
accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760
aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820
ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880
aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940
acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000
aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060
gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120
aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180
ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240
ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300
tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360
ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420
ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480
tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540
tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600
tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660
tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720
tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780
ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840
tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900
gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960
agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020
ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080
gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140
agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200
acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260
acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320
tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380
tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440
acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500
gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560
tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620
tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680
gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740
cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800
ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860
actacgcttg a 4871
<210> 933
<211> 4805
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP88 plasmid sequence
<400> 933
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800
aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860
gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920
cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980
ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040
agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100
gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160
acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220
tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280
gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340
actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400
acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460
gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520
tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580
gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640
ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700
tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760
gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820
gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880
agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940
ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000
accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060
tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120
agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180
tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240
gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300
ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360
tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420
aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480
acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540
acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600
tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660
tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720
tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780
gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840
cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900
gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960
gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020
acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080
atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140
ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200
tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260
ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320
ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380
agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440
tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500
agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560
agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620
gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680
ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740
tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800
acgct 4805
<210> 934
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 934
Asp Cys Leu Asp Phe Asp Asn Asp
1 5
<210> 935
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 935
Asp Leu Val Leu Leu Ser Ala Glu
1 5
<210> 936
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 936
Pro Gln Val Met Ala Ala Val Ala
1 5
<210> 937
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 937
Ala Arg Gln Met Thr Ala His Thr
1 5
<210> 938
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 938
Ser Ser Leu Tyr Pro Val Leu Pro
1 5
<210> 939
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 939
Ser Ser Leu Tyr Pro Ala Leu Thr
1 5
<210> 940
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 940
Ala Gly Gly Arg Ser Trp Lys Ala
1 5
<210> 941
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 941
Ser Glu Glu Tyr Pro Ile Met Ile
1 5
<210> 942
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 942
Gly Gly Asn Tyr Pro Val Gln Gln
1 5
<210> 943
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 943
Arg Glu Val Tyr Pro Ile Val Asn
1 5
<210> 944
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 944
Thr Ser Cys Tyr His Cys Gly Thr
1 5
<210> 945
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 945
Pro Ala Ile Leu Pro Ile Ile Ser
1 5
<210> 946
<211> 8
<212> PRT
<213> Artificial Sequence
<220>
<223> cleavage site
<400> 946
Pro Gln Val Leu Pro Val Met His
1 5
<210> 947
<211> 2413
<212> DNA
<213> Artificial Sequence
<220>
<223> pStx42.174.12.7 plasmid sequence
<400> 947
gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120
atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180
attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240
gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300
agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360
aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420
cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480
cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540
actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600
cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660
ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720
ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780
gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840
gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900
ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960
cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020
caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080
taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800
ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860
gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920
agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980
aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040
tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100
gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280
acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340
gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400
tttttttgaa ttc 2413
<210> 948
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 plasmid sequence
<400> 948
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 949
<211> 5178
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP40 plasmid sequence
<400> 949
atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60
ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120
agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180
agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240
ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300
ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360
cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420
ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480
atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540
tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660
gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720
gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780
ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840
gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960
gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020
aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080
gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140
gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200
gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260
cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320
cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380
gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440
agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggt 1500
tctggcggca gagcccgggg cctgtgctac acctgcggat cccctggaca ctaccaggcc 1560
cagtgtccta agaaaagaaa gtctggtaac agcagagagc ggtgccagct gtgtgatggc 1620
atgggccaca acgccaaaca gtgccggaga cgggacggaa accaaggaca aagacccggc 1680
cggggactga gcagcggacc ttggcctgtc agccagcaac ctgccgtgtc cctggctatg 1740
accatggaac acaaggaccg gcctctggtg cgggtgatcc tgacaaatac cggctctcac 1800
cccgtgaagc agcggtcagt gtacatcaca gccctgctgg acagcggcgc tgatatcacc 1860
atcattagcg aggaggactg gcctaccgac tggcccgtga tggaagctgc caatccccag 1920
atccacggca tcggaggcgg aatcccgatg agaaagtcca gagacatgat cgaggtgggc 1980
gtgatcaacc gggacggctc tcttgagaga cctctgctgc tgttccccgc cgtggctatg 2040
gtgcgaggca gcatcctggg ccgcgactgc ctgcagggcc tgggcctgag actgaccaac 2100
ctgaacttta gccagggtgc caccagctgc taccactgcg gcaccggcgg cagcccaaag 2160
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 2220
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 2280
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 2340
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 2400
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 2460
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2520
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2580
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2640
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2700
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2760
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2820
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2880
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2940
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 3000
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 3060
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 3120
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 3180
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 3240
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 3300
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 3360
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 3420
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3480
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3540
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3600
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3660
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3720
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3780
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3840
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3900
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3960
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 4020
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 4080
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 4140
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 4200
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 4260
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 4320
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 4380
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 4440
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4500
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4560
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4620
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4680
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4740
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4800
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4860
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4920
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4980
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 5040
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 5100
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 5160
gtccctgact acgcttga 5178
<210> 950
<211> 5187
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP41 plasmid sequence
<400> 950
atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60
ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120
agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180
cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240
ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300
ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360
agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420
cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480
attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540
tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660
gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720
gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780
ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840
gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960
gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020
aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080
gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140
gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200
gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260
cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320
caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380
gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440
tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagacaggc 1500
tccggcggcc gggccagaga gctgtgctac acctgtggct ctccaggcca ctaccaggct 1560
cagtgtccta aaaagcggaa gtctggcaat tctagagagc ggtgccagct gtgcaacggc 1620
atgggccata atgccaaaca gtgtcggaaa cgggacggaa accagggcca gagaccaggc 1680
agaggcctgt cttctggccc ctggcccggc cctgagcctc ctgctgtgtc cctggctatg 1740
accatggaac acaaggacag acccctggtg cgggtgatcc tgacaaacac cggaagccac 1800
cccgtgaagc agcgctccgt gtacatcaca gcccttctgg acagcggcgc cgacatcacc 1860
atcatcagcg aggaagattg gcctacagac tggcctgtga tggaagccgc aaacccccag 1920
atccacggca tcggcggagg tatacccatg cggaagagca gagacatgat cgagctgggc 1980
gtgatcaacc gggacggcag cctggaacgg cccctgctgt tgtttcctgc tgtggctatg 2040
gtgcggggaa gcatcctggg cagagattgc ctgcagggcc tgggcctgcg cctgaccaac 2100
ctgtgaggag ggccactgtt ctcaggtgcc acatcttgtt accactgcgg caccggcggc 2160
agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 2220
aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 2280
ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 2340
cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 2400
accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 2460
gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 2520
aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 2580
cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 2640
tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 2700
cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 2760
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2820
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2880
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2940
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 3000
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 3060
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 3120
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 3180
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 3240
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 3300
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 3360
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 3420
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 3480
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 3540
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 3600
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 3660
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 3720
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3780
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3840
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3900
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3960
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 4020
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 4080
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 4140
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 4200
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 4260
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 4320
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 4380
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 4440
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 4500
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 4560
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 4620
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 4680
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 4740
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4800
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4860
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4920
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4980
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 5040
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 5100
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 5160
ccatatgatg tccctgacta cgcttga 5187
<210> 951
<211> 5684
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP42 plasmid sequence
<400> 951
atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60
agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120
tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180
cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240
ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300
aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360
gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420
ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480
tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540
ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600
aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660
gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720
agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780
gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840
atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900
ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960
ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020
aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080
gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140
agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200
cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260
aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320
gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380
tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440
gctctgcagg gcaaaagcat caaggaagtg cttttccagc agcaagctcg gaacaagcgg 1500
ggaagacaga gaagcggcaa tagcggttgt tttgtgtgcg gccagcccgg ccaccgcgcc 1560
gccgtgtgcc cccagaagca gcagagcccc gtgaacaccc ctaatctgtg cccgcgctgt 1620
aaaaaaggaa agcattgggc acgagattgc cggtccaaaa cagatgttca aggtacccct 1680
ttacccccgg tgtcgggaaa ctgggtgagg ggccagcccc tggccccgaa acaatgttat 1740
ggggcaacac tgcaggttcc aaaagaacca ttgcagacct ctgtcgagcc acaagaggca 1800
gcgcgggatt ggacctctgt gccacctcct acacagtatt aactcccgag atgggggtcc 1860
aaaccctggc tacaggcgtg ttcggtcctc tgccccccgg caccgccggc ctgctgctgg 1920
gcagaagcag cgccagcctg aagggcatcc tgatccatcc tggagtgatt gacagcgact 1980
acaccggcga gatcaagatc ctggcctctg cccctaacaa gatcatcgtg atcaacgccg 2040
gccaaagaat cgcccagctg ctgctcgtgc ctctggtgat ccagggcaaa accatcaacc 2100
gggacaggca ggacaaggga tttggatctt ctgacgccta ttgggtgcag aacgtgaccg 2160
aggccagacc tgaactggaa cttagaatca atggcaagct gttccggggc gtgctggata 2220
caggcgccga catcagcgtg atcagcgaca aatactggcc caccacctgg cctaagcaga 2280
tggctatctc tacactgcag ggcatcggcc agacaaccaa ccccgagcag agcagcagcc 2340
tgctgacctg gaaggacaag gacggccaca ccggccaatt caagccctac atcctgcctc 2400
acctgcctgt gaacctgtgg ggcagagata tcctgagcaa gatgggcgtc tacctgtact 2460
cccctagccc taccgtgaca gatctgatgc tggaccaggg cctgctgcct aatcagggcc 2520
tcggaaagca acaccaggga attatcctgc cactggacct gaaaagcaac caggatagaa 2580
agggcctggg atgcttcccc tgaggacctc tgattctcct gggtgccgac tgcctggatt 2640
tcgacaatga cggcggcagc ccaaagaaga agcggaaggt ctctagacaa gagatcaaga 2700
gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag gccggcaaga 2760
caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga gagcggctgg 2820
aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc agcagggcca 2880
acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg cacgtgtact 2940
gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag cctgccagca 3000
agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat ctgaccacag 3060
ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt 3120
ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc gagcacgaga 3180
agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc gtgacctaca 3240
gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg accaaagaaa 3300
gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc tctggacctg 3360
tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc 3420
aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc 3480
tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg cctcctcagc 3540
ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg agaatgtggg 3600
tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag cctctgctga 3660
gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa gtggattggt 3720
gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat ggcaaggttt 3780
tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac ctgagcagcg 3840
aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac ctgctgctgc 3900
acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc tgggagagaa 3960
tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa agaaggagcg 4020
aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc agctttgtga 4080
tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg aagctgcaga 4140
agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac agcatcctgg 4200
acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa gacggcgtca 4260
agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg cggttcaaga 4320
agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac aaaaagtccg 4380
gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg attatcctgc 4440
ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg ctgagcctgg 4500
aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg tacaacagga 4560
gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga agagaggtgc 4620
tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc gagaatatcc 4680
ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc aaggactccc 4740
tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag cagaggacaa 4800
tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg aagtacgcca 4860
gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat ctgctgtact 4920
acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc ttcggccggc 4980
agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat tggctcacag 5040
ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg gcccagtata 5100
cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac gacagagtgc 5160
tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc aaagagctga 5220
aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc gtgaaggatc 5280
tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc agcagctgga 5340
caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc cacagacctg 5400
tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat gaacaggctg 5460
ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag aagtaccaga 5520
ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg cagagcttct 5580
acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa 5640
aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5684
<210> 952
<211> 5637
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP43 plasmid sequence
<400> 952
atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60
tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120
aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180
ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240
tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300
agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360
agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420
accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480
gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540
gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600
aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660
cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720
gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780
gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840
gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900
cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960
tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020
gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080
aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140
tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200
gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260
ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320
atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380
tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440
agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500
agaggacaaa agtacagcac cttcgtgaaa cagacatacg gcggcggaaa aggcggacag 1560
ggctctgaag gccctgtgtg cttcagctgc ggcaaaacag gtcacattaa gcgggattgc 1620
aaggaagaga aaggaagcaa gcgcgctcct cctggactgt gtcctagatg caagaaaggc 1680
taccactgga agagcgagtg caagagcaag ttcgacaagg acggcaaccc tctgccacca 1740
ctggaaacta acgccgaaaa cagcaaaaac cccacacaga aaggcgacaa aggaaaggac 1800
agcggactga accccgaagc ccctcctttc accatccacg acctgccacg aggcacccca 1860
ggcagtgccg gcttggacct gagcagccag aaagacctga tcctgtctct ggaagacggc 1920
gtgtccctgg tgccaaccct ggtgaagggc accctgcccg agggcaccac gggactgatc 1980
atcggcagat ccagcaacta caagaaaggc ctggaggtgc tgcccggcgt gatcgactcc 2040
gacttccagg gcgaaattaa ggtcatggta aaggccgcta agaacgccgt gatcatccac 2100
aagggcgagc ggatcgcgca gctgctgctg ctgccttatc tgaaactgcc taaccctatc 2160
atcaaggagg aaagaggcag cgagggattt ggcagcacct cccacgtgca ctgggtgcag 2220
gagatcagcg acagcagacc catgctgcac atcagcctga acggcagaag attcctgggc 2280
ctgctggaca ccggggccga taagacctgc atcgccggca gagattggcc cgccaactgg 2340
cctattcacc agaccgagag cagcctgcag ggcttgggaa tggcttgtgg cgtggctaga 2400
agctctcagc ctctgagatg gcagcacgag gataagtctg gcattatcca tcctttcgtg 2460
atccccacat tgccttttac cctctggggc cgggacatca tgaaagagat aaaggtgcgg 2520
ctgatgaccg atagcccaga cgacagccag gatctgacat ctctgtacgg cttaggtgcc 2580
gacctggtgc tgctgagcgc cgagggcggc agcccaaaga agaagcggaa ggtctctaga 2640
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2700
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2760
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2820
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2880
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2940
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 3000
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 3060
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 3120
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 3180
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 3240
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 3300
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 3360
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 3420
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 3480
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 3540
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 3600
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3660
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3720
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3780
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3840
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3900
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3960
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 4020
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 4080
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 4140
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 4200
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 4260
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 4320
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 4380
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 4440
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 4500
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 4560
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 4620
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4680
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4740
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4800
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4860
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4920
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4980
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 5040
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 5100
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 5160
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 5220
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 5280
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 5340
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 5400
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 5460
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 5520
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 5580
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 5637
<210> 953
<211> 5811
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP44 plasmid sequence
<400> 953
atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60
acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120
acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180
gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240
agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300
gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360
accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420
tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480
ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540
gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600
agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660
cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720
ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780
caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840
aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900
gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960
gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020
ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080
gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140
tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200
accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260
gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320
ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380
agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440
aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500
aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560
cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaaggactt cctgaacaac 1620
aagaacaagg aaaagggcgg atgttgtttt aagtgcggca agaaaggaca ctttgccaaa 1680
aactgccacg agcacgccca caacaacgcc gagcccaagg tgcccggcct gtgtcctcgg 1740
tgcaagagag gcaagcactg ggccaatgag tgcaagtcca agacagataa ccagggaaat 1800
ccaatccccc cccatcaggg aaatggtgct tctcctagac ctagaaacaa gctgatgggc 1860
caaagcgccc tgttccagcc taccaagaca acccacttca aggcctacca gagccacccc 1920
agaaagtgca gaatcggccc tctgttccac ctgccccaca gcatcaacgc ctgaaatggg 1980
gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040
cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100
tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160
tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220
acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccagcc 2280
tatcacctgt cagaagcctt ctctgaccct gtggctggac gacaagatgt tcaccggcct 2340
catcgacacc ggcgccgacg tgacaatcat caagctggaa gattggcctc caaattggcc 2400
cattacagat accctgacca acctgagagg catcggacag tccaacaacc ccaagcagag 2460
cagcaagtac ctgacatggc gggacaagga gaacaacagc ggcctgatca aaccttttgt 2520
gatccccaat ctgcctgtga acctgtgggg aagagatctg ctgtctcaga tgaagatcat 2580
gatgtgcagc ccaaacgaca tcgtgaccgc ccagatgctg gctcaaggct acagccccgg 2640
caaaggcctg ggcaagaaag agaatggaat cctgcaccct atccctaacc agggccagag 2700
caacaagaag ggcttcggca acttctgact gcggccattg acatacttgg tgccccacag 2760
gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820
atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880
ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940
cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000
agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060
gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120
gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180
accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240
caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300
cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360
acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420
aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480
ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540
aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600
gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660
cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720
atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780
ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840
gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900
aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960
agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020
ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080
gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140
aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200
tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260
ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320
atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380
ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440
ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500
aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560
atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620
agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680
aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740
gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800
aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860
gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920
aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980
tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040
ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100
ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160
ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220
cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280
agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340
gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400
aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460
agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520
agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580
caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640
taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700
agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760
aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811
<210> 954
<211> 4779
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP45 plasmid sequence
<400> 954
atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60
ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120
aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180
ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240
aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300
ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360
agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420
ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480
gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540
acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600
cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660
cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720
ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780
cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840
ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900
aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960
gccctgctgg tgcacacccc aggaccaaag atgcctggac cacgccagcc agcacctaag 1020
aggccaccac ctggaccttg ctacagatgt ctgaaggagg gacactgggc cagggactgc 1080
ccaacaaagg caaccggccc accacctgga ccatgcccca tctgtaagga cccaagccac 1140
tggaagcgcg attgtcccac actgaagtcc aagaattaat agagggggga cttagcgccc 1200
cccaaaccat aacacctata acagattctc ttagtgaggc cgaattagaa tgcttactct 1260
ctattcctct ggcccggagc cgccctagcg tggccgtgta cctgagcggc ccttggctgc 1320
aaccttctca gaaccaggcc ctgatgctgg ttgatacagg cgccgagaac accgtgctgc 1380
ctcagaattg gctggtgcgg gactacccca gaatccctgc cgctgtgctg ggagccggag 1440
gcgtgtcccg gaacagatac aactggctgc agggccctct tacactggct ctgaaacctg 1500
aaggcccatt catcaccatc ccaaagatcc tggtcgacac cttcgacaag tggcagatcc 1560
tgggcagaga tgtgctgagc agactgcagg ccagcatcag catccccgag gaagtgcggc 1620
cccccgtggt gggcgtcttg gatgcccccc cgagccacat tggattagaa catctgcccc 1680
ccccacctga ggtgcctcaa ttccctttaa actagaggtg ccccagccat cctgcccatc 1740
atctccggcg gcagcccaaa gaagaagcgg aaggtctcta gacaagagat caagagaatc 1800
aacaagatca gaaggagact ggtcaaggac agcaacacaa agaaggccgg caagacaggc 1860
cccatgaaaa ccctgctcgt cagagtgatg acccctgacc tgagagagcg gctggaaaac 1920
ctgagaaaga agcccgagaa catccctcag cctatcagca acaccagcag ggccaacctg 1980
aacaagctgc tgaccgacta caccgagatg aagaaagcca tcctgcacgt gtactgggaa 2040
gagttccaga aagaccccgt gggcctgatg agcagagttg ctcagcctgc cagcaagaag 2100
atcgaccaga acaagctgaa gcccgagatg gacgagaagg gcaatctgac cacagccggc 2160
tttgcctgct ctcagtgtgg ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag 2220
aaaggcaagg cctacaccaa ctacttcggc agatgtaacg tggccgagca cgagaagctg 2280
attctgctgg cccagctgaa acctgagaag gactctgatg aggccgtgac ctacagcctg 2340
ggcaagtttg gacagagagc cctggacttc tacagcatcc acgtgaccaa agaaagcaca 2400
caccccgtga agcccctggc tcagatcgcc ggcaatagat acgcctctgg acctgtgggc 2460
aaagccctgt ccgatgcctg catgggaaca atcgccagct tcctgagcaa gtaccaggac 2520
atcatcatcg agcaccagaa ggtggtcaag ggcaaccaga agagactgga aagcctgagg 2580
gagctggccg gcaaagagaa cctggaatac cccagcgtga ccctgcctcc tcagcctcac 2640
acaaaagaag gcgtggacgc ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac 2700
ctgaacctgt ggcagaagct gaaactgtcc agggacgacg ccaagcctct gctgagactg 2760
aagggcttcc ctagcttccc tctggtggaa agacaggcca atgaagtgga ttggtgggac 2820
atggtctgca acgtgaagaa gctgatcaac gagaagaaag aggatggcaa ggttttctgg 2880
cagaacctgg ccggctacaa gagacaagaa gccctgaggc cttacctgag cagcgaagag 2940
gaccggaaga agggcaagaa gttcgccaga taccagctgg gcgacctgct gctgcacctg 3000
gaaaagaagc acggcgagga ctggggcaaa gtgtacgatg aggcctggga gagaatcgac 3060
aagaaggtgg aaggcctgag caagcacatt aagctggaag aggaaagaag gagcgaggac 3120
gcccaatcta aagccgctct gaccgattgg ctgagagcca aggccagctt tgtgatcgag 3180
ggcctgaaag aggccgacaa ggacgagttc tgcagatgcg agctgaagct gcagaagtgg 3240
tacggcgatc tgagaggcaa gcccttcgcc attgaggccg agaacagcat cctggacatc 3300
agcggcttca gcaagcagta caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa 3360
ctgaacctgt acctgatcat caattacttc aaaggcggca agctgcggtt caagaagatc 3420
aaacccgagg ccttcgaggc taacagattc tacaccgtga tcaacaaaaa gtccggcgag 3480
atcgtgccca tggaagtgaa cttcaacttc gacgacccca acctgattat cctgcctctg 3540
gccttcggca agagacaggg cagagagttc atctggaacg atctgctgag cctggaaacc 3600
ggctctctga agctggccaa tggcagagtg atcgagaaaa ccctgtacaa caggagaacc 3660
agacaggacg agcctgctct gtttgtggcc ctgaccttcg agagaagaga ggtgctggac 3720
agcagcaaca tcaagcccat gaacctgatc ggcgtggacc ggggcgagaa tatccctgct 3780
gtgatcgccc tgacagaccc tgaaggatgc ccactgagca gattcaagga ctccctgggc 3840
aaccctacac acatcctgag aatcggcgag agctacaaag agaagcagag gacaatccag 3900
gccaagaaag aggtggaaca gagaagagcc ggcggatact ctaggaagta cgccagcaag 3960
gccaagaatc tggccgacga catggtccga aacaccgcca gagatctgct gtactacgcc 4020
gtgacacagg acgccatgct gatcttcgag aatctgagca gaggcttcgg ccggcagggc 4080
aagagaacct ttatggccga gaggcagtac accagaatgg aagattggct cacagctaaa 4140
ctggcctacg agggactgag caagacctac ctgtccaaaa cactggccca gtatacctcc 4200
aagacctgca gcaattgcgg cttcaccatc accagcgccg actacgacag agtgctggaa 4260
aagctcaaga aaaccgccac cggctggatg accaccatca acggcaaaga gctgaaggtt 4320
gagggccaga tcacctacta caacaggtac aagaggcaga acgtcgtgaa ggatctgagc 4380
gtggaactgg acagactgag cgaagagagc gtgaacaacg acatcagcag ctggacaaag 4440
ggcagatcag gcgaggctct gagcctgctg aagaagaggt ttagccacag acctgtgcaa 4500
gagaagttcg tgtgcctgaa ctgcggcttc gagacacacg ccgatgaaca ggctgccctg 4560
aacattgcca gaagctggct gttcctgaga agccaagagt acaagaagta ccagaccaac 4620
aagaccaccg gcaacaccga caagagggcc tttgtggaaa cctggcagag cttctacaga 4680
aaaaagctga aagaagtctg gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta 4740
gccctcgagt acccatatga tgtccctgac tacgcttga 4779
<210> 955
<211> 5078
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP46 plasmid sequence
<400> 955
atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60
gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120
tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180
tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240
aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300
cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360
tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420
aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480
gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540
acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600
caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660
aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720
agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780
ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840
ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900
tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960
accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020
accaaggtgc tggtggtgca gcctaagaag cctcccccta atcagccctg cttccggtgc 1080
ggcaaggccg gacactggag ccgggactgc acccagcctc ggcctccacc gggaccttgt 1140
cctctgtgcc aagaccccac acactggaag agagattgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggaggtttaa cctctcctcc taccctgcag caggtgttcc 1320
tgaatcaaga tcctgccagc atcctgcctg tgatccccct cgaccccgct agaagacctg 1380
tgatcaaggc ccaggtggac acacagacct cccaccccaa aacaatcgag gccctgctgg 1440
acaccggcgc tgatatgaca gtgctgccaa tcgccctgtt cagcagcaac acccctctga 1500
aaaacaccag cgtgctcgga gccggcggac agacccagga ccacttcaag ctgacaagcc 1560
tgcctgtcct gatccggctg cccttcagaa ccacacctat cgtgctgacc agctgcctgg 1620
tggacacaaa gaacaactgg gccatcatcg gcagggacgc cctgcaacag tgccagggcg 1680
tgctgtacct gccagaggcc aagggccccc ccgttatcct gcctatccag gcccctgccg 1740
tgctgggcct ggaacacctg ccaagacccc cccagatcag ccaatttcct ctgaaccaga 1800
acgccagcag accatgtaat acctggtccg gcagaccttg gcggcaggcc atttctaacc 1860
ccacccccgg ccaggagatc acccagtaca gccagctgaa gcggcctatg gaacctggag 1920
attctagcac cacctgcggc cctctgacac tgtgaccata gacctctcat catcttcccc 1980
cgggccccct gacttgtcca gcctgccaac cacacggtgc ccctcaagtg ctgccagtga 2040
tgcacggcgg cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca 2100
acaagatcag aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc 2160
ccatgaaaac cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc 2220
tgagaaagaa gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga 2280
acaagctgct gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag 2340
agttccagaa agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga 2400
tcgaccagaa caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct 2460
ttgcctgctc tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga 2520
aaggcaaggc ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga 2580
ttctgctggc ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg 2640
gcaagtttgg acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac 2700
accccgtgaa gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca 2760
aagccctgtc cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca 2820
tcatcatcga gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg 2880
agctggccgg caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca 2940
caaaagaagg cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc 3000
tgaacctgtg gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga 3060
agggcttccc tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca 3120
tggtctgcaa cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc 3180
agaacctggc cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg 3240
accggaagaa gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg 3300
aaaagaagca cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca 3360
agaaggtgga aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg 3420
cccaatctaa agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg 3480
gcctgaaaga ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt 3540
acggcgatct gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca 3600
gcggcttcag caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac 3660
tgaacctgta cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca 3720
aacccgaggc cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga 3780
tcgtgcccat ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg 3840
ccttcggcaa gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg 3900
gctctctgaa gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca 3960
gacaggacga gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca 4020
gcagcaacat caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg 4080
tgatcgccct gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca 4140
accctacaca catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg 4200
ccaagaaaga ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg 4260
ccaagaatct ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg 4320
tgacacagga cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca 4380
agagaacctt tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac 4440
tggcctacga gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca 4500
agacctgcag caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa 4560
agctcaagaa aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg 4620
agggccagat cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg 4680
tggaactgga cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg 4740
gcagatcagg cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag 4800
agaagttcgt gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga 4860
acattgccag aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca 4920
agaccaccgg caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa 4980
aaaagctgaa agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag 5040
ccctcgagta cccatatgat gtccctgact acgcttga 5078
<210> 956
<211> 5244
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP47 plasmid sequence
<400> 956
atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60
accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120
aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180
gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240
cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300
aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360
acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420
aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480
ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540
aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600
gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660
aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720
aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780
ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840
aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900
atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960
acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020
aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080
accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140
gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200
aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260
gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320
cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380
gcccagacaa tgaacggcaa taagggctac gtgggctcct atcctaccaa cgagccatac 1440
tattctttcc agcagcagca gaggccagca cccagagccc ctccaggcaa cgtgccttcc 1500
aatacctgct tcttttgtaa gcagccagga cactggaagg cagactgccc taataagaca 1560
aggaacctgc gcaatatggg caacatggga aggggaggaa gaatgggagg accaccttac 1620
cggagccagc cttatccagc ctttatccag ccaccccaga atcaccagaa ccagtataat 1680
ggcaggatgg atcgctctca gctgcaggcc agcgcccagg agtggctgcc aggaacctac 1740
cctgcatgag acccaatcga ttgcccctat gagaagagcg gcacaaagac cacacaggac 1800
gtgatcacca caaagaatgc cgagatcatg gtgaccgtga accacacaaa gatcccaatg 1860
ctggtggata ccggcgcctg tctgacagca atcggaggag cagcaaccgt ggtgccagac 1920
ctgaagctga ccaacacaga gatcatcgca gtgggaatct ctgccgagcc cgtgcctcac 1980
gtgctggcca agccaaccaa gatccagatc gagaacacaa atatcgatat cagcccttgg 2040
tacaatccag accagacctt ccacatcctg ggccgcgaca cactgtctaa gatgcgggcc 2100
atcgtgagct ttgagaagaa cggcgagatg accgtgctgc tgcctccaac atatcacaag 2160
cagctgtcct gtcagaccaa gggtgccgca aggcagatga ccgcacacac aggcggcagc 2220
ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 2280
agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 2340
ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 2400
gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 2460
gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 2520
cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 2580
ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 2640
tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2700
accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2760
ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2820
agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2880
ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2940
gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 3000
cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 3060
gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 3120
gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 3180
aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 3240
ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 3300
aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 3360
tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 3420
aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 3480
gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 3540
ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 3600
gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3660
gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3720
ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3780
cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3840
atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3900
gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3960
gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 4020
cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 4080
gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 4140
gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 4200
cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 4260
gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 4320
ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 4380
gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 4440
gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 4500
atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 4560
gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 4620
ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4680
tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4740
gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4800
tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4860
ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4920
gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4980
ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 5040
tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 5100
accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 5160
gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 5220
tatgatgtcc ctgactacgc ttga 5244
<210> 957
<211> 4962
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP48 plasmid sequence
<400> 957
atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60
gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120
gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180
atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240
ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300
ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360
cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420
ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480
cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540
tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600
gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660
aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720
atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780
accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840
ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900
tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960
gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020
cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080
tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140
taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200
acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260
gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320
atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaagacag agaggaatcg 1380
aagctgggcg accagagaaa gatccccctt ggcaaggacc aatgtgccta ctgcaaggaa 1440
aaaggccact gggtgaggga ctgtcccaag agacccagaa agaagcccgc aaacagcaca 1500
ctgctgaacc tgggcgatca ggagagccaa ggccaggacc cccctcctga gcctagaatc 1560
accctgaaga ttggaggcca gcctgtgacc tttctggtgg acaccggcgc ccaacactct 1620
gtgctgacca gacctgatgg ccccctcagc gatagaaccg ccctggtcca gggagctaca 1680
ggcagcaaga actacagatg gaccaccgac agaagggtgc agctggctac tggcaaggtg 1740
acacacagct ttctgtacgt gcccgagtgc ccttaccccc tcctgggcag agatctgttg 1800
acaaagctga aggcccaaat ccacttcacc ggagagggcg ctaatgtggt gggccccaag 1860
ggcctgcctc ttcaggtgct gacactgcaa ctggaagagg gtgccagctc tctgtaccct 1920
gtgctgcctg gcggcagccc aaagaagaag cggaaggtct ctagacaaga gatcaagaga 1980
atcaacaaga tcagaaggag actggtcaag gacagcaaca caaagaaggc cggcaagaca 2040
ggccccatga aaaccctgct cgtcagagtg atgacccctg acctgagaga gcggctggaa 2100
aacctgagaa agaagcccga gaacatccct cagcctatca gcaacaccag cagggccaac 2160
ctgaacaagc tgctgaccga ctacaccgag atgaagaaag ccatcctgca cgtgtactgg 2220
gaagagttcc agaaagaccc cgtgggcctg atgagcagag ttgctcagcc tgccagcaag 2280
aagatcgacc agaacaagct gaagcccgag atggacgaga agggcaatct gaccacagcc 2340
ggctttgcct gctctcagtg tggccagcct ctgttcgtgt acaagctgga acaggtgtcc 2400
gagaaaggca aggcctacac caactacttc ggcagatgta acgtggccga gcacgagaag 2460
ctgattctgc tggcccagct gaaacctgag aaggactctg atgaggccgt gacctacagc 2520
ctgggcaagt ttggacagag agccctggac ttctacagca tccacgtgac caaagaaagc 2580
acacaccccg tgaagcccct ggctcagatc gccggcaata gatacgcctc tggacctgtg 2640
ggcaaagccc tgtccgatgc ctgcatggga acaatcgcca gcttcctgag caagtaccag 2700
gacatcatca tcgagcacca gaaggtggtc aagggcaacc agaagagact ggaaagcctg 2760
agggagctgg ccggcaaaga gaacctggaa taccccagcg tgaccctgcc tcctcagcct 2820
cacacaaaag aaggcgtgga cgcctacaac gaagtgatcg ccagagtgag aatgtgggtc 2880
aacctgaacc tgtggcagaa gctgaaactg tccagggacg acgccaagcc tctgctgaga 2940
ctgaagggct tccctagctt ccctctggtg gaaagacagg ccaatgaagt ggattggtgg 3000
gacatggtct gcaacgtgaa gaagctgatc aacgagaaga aagaggatgg caaggttttc 3060
tggcagaacc tggccggcta caagagacaa gaagccctga ggccttacct gagcagcgaa 3120
gaggaccgga agaagggcaa gaagttcgcc agataccagc tgggcgacct gctgctgcac 3180
ctggaaaaga agcacggcga ggactggggc aaagtgtacg atgaggcctg ggagagaatc 3240
gacaagaagg tggaaggcct gagcaagcac attaagctgg aagaggaaag aaggagcgag 3300
gacgcccaat ctaaagccgc tctgaccgat tggctgagag ccaaggccag ctttgtgatc 3360
gagggcctga aagaggccga caaggacgag ttctgcagat gcgagctgaa gctgcagaag 3420
tggtacggcg atctgagagg caagcccttc gccattgagg ccgagaacag catcctggac 3480
atcagcggct tcagcaagca gtacaactgc gccttcattt ggcagaaaga cggcgtcaag 3540
aaactgaacc tgtacctgat catcaattac ttcaaaggcg gcaagctgcg gttcaagaag 3600
atcaaacccg aggccttcga ggctaacaga ttctacaccg tgatcaacaa aaagtccggc 3660
gagatcgtgc ccatggaagt gaacttcaac ttcgacgacc ccaacctgat tatcctgcct 3720
ctggccttcg gcaagagaca gggcagagag ttcatctgga acgatctgct gagcctggaa 3780
accggctctc tgaagctggc caatggcaga gtgatcgaga aaaccctgta caacaggaga 3840
accagacagg acgagcctgc tctgtttgtg gccctgacct tcgagagaag agaggtgctg 3900
gacagcagca acatcaagcc catgaacctg atcggcgtgg accggggcga gaatatccct 3960
gctgtgatcg ccctgacaga ccctgaagga tgcccactga gcagattcaa ggactccctg 4020
ggcaacccta cacacatcct gagaatcggc gagagctaca aagagaagca gaggacaatc 4080
caggccaaga aagaggtgga acagagaaga gccggcggat actctaggaa gtacgccagc 4140
aaggccaaga atctggccga cgacatggtc cgaaacaccg ccagagatct gctgtactac 4200
gccgtgacac aggacgccat gctgatcttc gagaatctga gcagaggctt cggccggcag 4260
ggcaagagaa cctttatggc cgagaggcag tacaccagaa tggaagattg gctcacagct 4320
aaactggcct acgagggact gagcaagacc tacctgtcca aaacactggc ccagtatacc 4380
tccaagacct gcagcaattg cggcttcacc atcaccagcg ccgactacga cagagtgctg 4440
gaaaagctca agaaaaccgc caccggctgg atgaccacca tcaacggcaa agagctgaag 4500
gttgagggcc agatcaccta ctacaacagg tacaagaggc agaacgtcgt gaaggatctg 4560
agcgtggaac tggacagact gagcgaagag agcgtgaaca acgacatcag cagctggaca 4620
aagggcagat caggcgaggc tctgagcctg ctgaagaaga ggtttagcca cagacctgtg 4680
caagagaagt tcgtgtgcct gaactgcggc ttcgagacac acgccgatga acaggctgcc 4740
ctgaacattg ccagaagctg gctgttcctg agaagccaag agtacaagaa gtaccagacc 4800
aacaagacca ccggcaacac cgacaagagg gcctttgtgg aaacctggca gagcttctac 4860
agaaaaaagc tgaaagaagt ctggaagccc gccgtgacta gtccaaaaaa gaagagaaag 4920
gtagccctcg agtacccata tgatgtccct gactacgctt ga 4962
<210> 958
<211> 5061
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP49 plasmid sequence
<400> 958
atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60
cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120
gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180
atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240
ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300
gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360
cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420
aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480
gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540
gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600
aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660
ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720
aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780
atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840
gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900
cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960
tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020
ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080
cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140
ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200
tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260
ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320
gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380
cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440
gtggtgtccg gacagaagca ggacaggcag ggaggagaga ggcgccggtc tcagctggac 1500
cgcgatcagt gcgcctactg taaggagaag ggccactggg ccaaggattg ccccaagaag 1560
cctagaggcc caaggggccc taggccacag accagcctgc tgacactgga cgattgagga 1620
ggacagggac aggagccacc tccagagccc agaatcaccc tgaaggtcgg cggccagcct 1680
gtgacctttc tggtggacac aggcgcccag cacagcgtgc tgacccagaa tcccggccct 1740
ctgtctgata agagcgcctg ggtgcaggga gcaacaggcg gcaagcggta cagatggacc 1800
acagaccgga aggtgcacct ggccaccggc aaggtgacac acagctttct gcacgtgccc 1860
gactgtccat accccctgct gggcagagat ctgctgacca agctgaaggc acagatccac 1920
ttcgagggat ccggagcaca ggtcatggga ccaatgggac agcctctgca ggtgctgaca 1980
ctgaacatcg aggatgaggg tgccagctcc ctgtatcctg ccctgacagg cggcagccca 2040
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 2100
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 2160
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 2220
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2280
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2340
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2400
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2460
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2520
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2580
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2640
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2700
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2760
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2820
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2880
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2940
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 3000
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 3060
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 3120
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 3180
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3240
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3300
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3360
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3420
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3480
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3540
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3600
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3660
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3720
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3780
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3840
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3900
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3960
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 4020
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 4080
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 4140
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 4200
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4260
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4320
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4380
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4440
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4500
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4560
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4620
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4680
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4740
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4800
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4860
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4920
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4980
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 5040
gatgtccctg actacgcttg a 5061
<210> 959
<211> 4757
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP50 plasmid sequence
<400> 959
atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60
gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120
ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180
aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240
acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300
atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360
atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420
agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480
gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540
gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600
gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720
cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780
agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840
aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900
gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960
aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020
ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080
ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggcctgg caagggcaag 1140
ggaaacggac agccacagcg gtgctacaat tgtggcaagc caggacacca ggcaaggcag 1200
tgcaggcagg gcatcatatg tcacaactgt ggaaagagag gacatatgca aaaagaatgc 1260
agaggaaaga gagacataag gggaaaacag cagggaaacg ggaggagggg gatacgtgtg 1320
gtgccgtccg ctcctcctat ggaataacaa gcgcccctcc aatggtgcag gtgcggattg 1380
gatctcagca gcgcaacctg ctgttcgaca ccggcgccga tagaaccatc gtccggtggc 1440
acgagggctc cggcaacccc gccggcagaa tcaaactgca aggcatcggc ggaatcgtgg 1500
aaggcgagaa gtggaacaac gtggagctgg aatacaaggg cgagacaaga aagggcacca 1560
tcgtggtgct gcctcagagc cctgtggagg tgctgggacg ggacaacatg gcccggttcg 1620
gcatcaagat catcatggct aatctggagg aaaaaagaat ccccatcacc aaggtgaagt 1680
tgaaagaggg atgtggtgcc gcaggaggcc ggtcctggaa ggccggcggc agcccaaaga 1740
agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga aggagactgg 1800
tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc ctgctcgtca 1860
gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag cccgagaaca 1920
tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg accgactaca 1980
ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg 2040
gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac aagctgaagc 2100
ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct cagtgtggcc 2160
agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc tacaccaact 2220
acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc cagctgaaac 2280
ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga cagagagccc 2340
tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag cccctggctc 2400
agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc gatgcctgca 2460
tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag caccagaagg 2520
tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc aaagagaacc 2580
tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc gtggacgcct 2640
acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg cagaagctga 2700
aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct agcttccctc 2760
tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc 2820
tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc ggctacaaga 2880
gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag ggcaagaagt 2940
tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac ggcgaggact 3000
ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca 3060
agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa gccgctctga 3120
ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag gccgacaagg 3180
acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg agaggcaagc 3240
ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc aagcagtaca 3300
actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac ctgatcatca 3360
attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc ttcgaggcta 3420
acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact 3480
tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag agacagggca 3540
gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg 3600
gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag cctgctctgt 3660
ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc aagcccatga 3720
acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg acagaccctg 3780
aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac atcctgagaa 3840
tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag gtggaacaga 3900
gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg gccgacgaca 3960
tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac gccatgctga 4020
tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt atggccgaga 4080
ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag ggactgagca 4140
agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc aattgcggct 4200
tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa accgccaccg 4260
gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc acctactaca 4320
acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac agactgagcg 4380
aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc gaggctctga 4440
gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg tgcctgaact 4500
gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga agctggctgt 4560
tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc aacaccgaca 4620
agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa gaagtctgga 4680
agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg 4740
tccctgacta cgcttga 4757
<210> 960
<211> 4821
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP51 plasmid sequence
<400> 960
atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60
ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120
cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180
gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240
gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300
tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360
agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420
cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480
tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540
ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600
atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660
cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720
cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780
atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840
gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900
caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960
gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020
gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080
acaggcctgg ccggaccatt caagggaggc gccctgaagg gcggccccct gaaggccgcc 1140
cagacctgct ataactgtgg caagccagga cacctgagct cccagtgcag ggcaccaaag 1200
gtgtgcttca agtgtaagca gcctggccac ttttctaagc aatgcagaag tgttccaaaa 1260
aacgggaagc aaggggctca agggaggccc cagaaacaaa ctttcccgat acaacagaag 1320
agtcagcaca acaaatctgt tgtacaagag actcctcaga ctcaaaatct gtacccagat 1380
ctgagcgaaa taaaaaagga atacaatgtc aaggagaagg atcaagtaga ggatctcaac 1440
ctggacagtt tgtgggagta aacatataac ctggagaagc gccccaccac aatcgtgctg 1500
atcaacgaca cccctctgaa cgtgctgctg gacacaggag ctgatacatc tgtgctcacc 1560
accgcccact acaaccggct gaagtacaga ggcagaaagt accagggcac cggcatcatc 1620
ggcgtgggcg gaaatgtgga aaccttcagc accccagtga ccattaagaa aaagggccgg 1680
cacatcaaaa ccagaatgct ggtcgccgac atccctgtga caatcctggg cagagatatc 1740
cttcaggact taggtgcagg tgccagcgag gagtatccaa tcatgatcgg cggcagccca 1800
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1860
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1920
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1980
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 2040
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 2100
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 2160
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 2220
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 2280
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2340
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2400
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2460
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2520
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2580
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2640
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2700
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2760
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2820
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2880
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2940
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 3000
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 3060
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 3120
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 3180
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 3240
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3300
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3360
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3420
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3480
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3540
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3600
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3660
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3720
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3780
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3840
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3900
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3960
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 4020
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 4080
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 4140
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 4200
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 4260
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4320
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4380
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4440
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4500
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4560
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4620
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4680
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4740
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4800
gatgtccctg actacgcttg a 4821
<210> 961
<211> 4871
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP52 plasmid sequence
<400> 961
atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60
ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120
ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180
ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240
acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300
aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360
accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420
ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480
gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540
tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600
cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660
ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720
acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780
ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840
ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900
agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960
cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020
atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080
aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctgacca gctgccattt 1140
gccgccgtgc agcagaaggg ccagaggaag accatcaagt gctggaactg tggcaaggag 1200
ggacactctg ccaagcagtg cagggcacca aggcgccagg gatgctggaa gtgtggcaag 1260
acaggccacg tgatggccaa gtgtcctgag aggcaggcag gcttcctggg actgggacca 1320
tggggcaaga agccaagaaa ttttcctatg gcccagatgc ctcagggact gatcccaacc 1380
gcaccaccag aggacccagc agtggatctg ctgaagaact acatgaagat gggcaggaag 1440
cagcgcgaga atagggagcg cccttataag gaggtgacag aggacctgct gcacctgaac 1500
tctctctttg gagaagacca gtagttacag cctacatcga ggaacagcct gtggaagtgc 1560
tgctggatac aggagctgat gacagcatcg tggccggcat tgagctggga cctaactaca 1620
ccccaaagat cgtgggcggc atcggcggat tcatcaatac caaagagtac aaggacgtga 1680
agatcaaagt gctgggcaag gtgatcaagg gcaccatcat gaccggcgac acacccatca 1740
acatcttcgg cagaaacctg ctcaccgcca tgggcatgtc tctgaacctg cctatcgcca 1800
aggtcgaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860
ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920
acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980
tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040
agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100
tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160
tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220
tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280
tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340
gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400
aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460
tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520
ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580
caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640
agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700
accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760
aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820
ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880
aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940
acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000
aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060
gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120
aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180
ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240
ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300
tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360
ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420
ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480
tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540
tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600
tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660
tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720
tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780
ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840
tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900
gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960
agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020
ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080
gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140
agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200
acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260
acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320
tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380
tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440
acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500
gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560
tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620
tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680
gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740
cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800
ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860
actacgcttg a 4871
<210> 962
<211> 4700
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP53 plasmid Sequence
<400> 962
atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60
gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120
tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180
acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240
agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300
aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360
aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420
gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480
gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540
gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600
gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720
atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780
atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840
ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900
ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960
accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020
acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080
gagggcttta agatgcagct gctggcccag gccctgagac ctcagggcaa ggcaggacag 1140
aagggagtga accagaagtg ctacaattgt ggcaagccag gacacctggc aaggcagtgc 1200
agacagggaa tcatctgcca ccactgtggc aagaggggcc acatgcagaa ggactgtcgc 1260
cagaagaagc agcagggcaa caataggaga ggaccaaggg tggtgccatc tgccccacca 1320
atgctgtgac agaggcccct cctaagatcg agatcaaggt gggcacaaga tggaagaaac 1380
tgctggtcga caccggcgct gataagacca tcgtgaccag ccacgacatg agcggcatcc 1440
ccaagggcag aatcatcctg cagggcattg gaggaatcat cgagggcgag aagtgggagc 1500
aggtgcacct gcagtacaag gacaagatca tccggggcac catcgtggtg ctcgccacat 1560
ctccagtgga agtgctggga agagataaca tgcgggaact gggcatcggc ctgatcatgg 1620
ctaacctgga agagaaaggt gccagggagg tgtatccaat cgtgaatggc ggcagcccaa 1680
agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc agaaggagac 1740
tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa accctgctcg 1800
tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag aagcccgaga 1860
acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg ctgaccgact 1920
acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag aaagaccccg 1980
tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag aacaagctga 2040
agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg 2100
gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag gcctacacca 2160
actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg gcccagctga 2220
aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt ggacagagag 2280
ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg aagcccctgg 2340
ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg tccgatgcct 2400
gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc gagcaccaga 2460
aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc ggcaaagaga 2520
acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa ggcgtggacg 2580
cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc 2640
tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc cctagcttcc 2700
ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc aacgtgaaga 2760
agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg gccggctaca 2820
agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag aagggcaaga 2880
agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg 2940
actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg gaaggcctga 3000
gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct aaagccgctc 3060
tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa gaggccgaca 3120
aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat ctgagaggca 3180
agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc agcaagcagt 3240
acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg tacctgatca 3300
tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag gccttcgagg 3360
ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc atggaagtga 3420
acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc aagagacagg 3480
gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg aagctggcca 3540
atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac gagcctgctc 3600
tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac atcaagccca 3660
tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc ctgacagacc 3720
ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca cacatcctga 3780
gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa gaggtggaac 3840
agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat ctggccgacg 3900
acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag gacgccatgc 3960
tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc tttatggccg 4020
agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac gagggactga 4080
gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc agcaattgcg 4140
gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag aaaaccgcca 4200
ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag atcacctact 4260
acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg gacagactga 4320
gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca ggcgaggctc 4380
tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc gtgtgcctga 4440
actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc agaagctggc 4500
tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc ggcaacaccg 4560
acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg aaagaagtct 4620
ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag tacccatatg 4680
atgtccctga ctacgcttga 4700
<210> 963
<211> 5479
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP54 plasmid sequence
<400> 963
agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60
tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120
cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180
cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240
ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300
aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360
ctgtctcatc attttggcaa agaattcgcc accatggccc tgaatgattt cgaccctatc 420
gccctccagg gctacctgcc ggcccctaga gtgctgcaac acaacgacat catcatctgc 480
agagctactt ctggcccctg gggcatcggc gacagataca acctgatcag gatccacctg 540
caagaccctg ccggacagcc ccttccaatc ccccagtggg agcctatccc taaccggacc 600
gccaaccccc ggacacagcc ctaccctgtg gtgtctgccc caatggctac cctggaaaac 660
atcctgaaca actttcacat cccccacggc gtgtccagat acggccccct ggaaggcgga 720
gattaccagc ctggcgaaca gtacagccaa ggcttctgcc ctgtgaccca ggccgagatt 780
gccctgctga acggccagca cctggaagaa gagatcacaa tcctgagaga gatcacccac 840
agactgatgc agggcgtgcg gcctcctgcc gtgcctcagg gccctgctcc tcctcctcct 900
ccagctcagc ctcctgctcc cctgcctgct ccaccaattg ggcctccacc tcccgctgcc 960
cctgcccccg ccccaggccc catgcctgtg ccccagcatc tgcctattac acatatcaga 1020
gccgtgatcg gcgaaacccc cgccaacatc cgcgaggtgc cactgtggct ggctagagcc 1080
gttcccgccc tgcagggagt gtaccccgtc caggacgccg tgatgagaag ccgcaccgtg 1140
aacgccctga ccgtgcggca ccctggactg gccctggaac ctctggagtg cggcagctgg 1200
caagagtgtc tggccgccct gtggcagaga accttcggcg ccaccgccct gcacgccctg 1260
ggcgataccc tgggtcagat cgcaaacagc gacggcatcg tgatggctat cgagctgggc 1320
ctgctctttt ccgatgataa ctgggacctg gtgtggggaa tctgtagaag attcctgccc 1380
ggccaggccg tctgcgtggc cgtgcaggcc agactggatc ccctgcccga caacgctaca 1440
agaatcgtga tgatcagcca catcatccgg gacgtgtacg ccatcctggg cctggaccct 1500
ctgggcagac ccatgcagca gacactgcct agacggaaca accagcctcc cagacagcag 1560
ccacagagac ggcagcagcc tagaagaacc ggcaaccagg aggaaagagg ccagcggaac 1620
cggggccggc agaacgccca gacccctcgg caggagggca acagactgca gaacagccag 1680
ctgcctggcc ctcgcgactg ccccaacaat agcaaccagc ctcggtaccc tctgcggcca 1740
aacccccagc agccccaaag atacggccag gagcagaatc gtggcaacaa tcccaaccct 1800
tacagacaac ctacccctgg caatggaaat caaaacagaa acttcagccg ggggcctgcc 1860
ccagtcaatg agcagagcag aggcagagga agatctagcc agggtacaaa taacaccggc 1920
tcctctgctg tgcacagcgt gcggctgacc agcgccgccc ctcctatacc cccacaagat 1980
gccggcactc cgcccacttc aagtggaaat caagggcaat catcttaaag gctactggga 2040
cagcggcgcc gagatcacat gcgtgcccgc tatctacatc atcgaggaac aacctgttgg 2100
caagaagctg attacaacca tccacaacga gaaggaacat gatgtgtact acgtggaaat 2160
gaaaatcgag aagcggaagg tgcagtgtga agtgatcgcc accgccctgg attacgtgct 2220
ggtggcccct gtggacatcc cctggtataa gcctggacct ctggaactga ccatcaagat 2280
cgacgtcgag agccagaagc acaccctgat cacagagtcc accctctctc cacagggcca 2340
gatgagactg aagaaactgc tggaccagta ccaggccctg tggcagtgct gggagaacca 2400
ggtgggccac agaagaggtg cctctgctgt gcacagcgtg cggctgggcg gcagcccaaa 2460
gaagaagcgg aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact 2520
ggtcaaggac agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt 2580
cagagtgatg acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa 2640
catccctcag cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta 2700
caccgagatg aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt 2760
gggcctgatg agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa 2820
gcccgagatg gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg 2880
ccagcctctg ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa 2940
ctacttcggc agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa 3000
acctgagaag gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc 3060
cctggacttc tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc 3120
tcagatcgcc ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg 3180
catgggaaca atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa 3240
ggtggtcaag ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa 3300
cctggaatac cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc 3360
ctacaacgaa gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct 3420
gaaactgtcc agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc 3480
tctggtggaa agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa 3540
gctgatcaac gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa 3600
gagacaagaa gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa 3660
gttcgccaga taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga 3720
ctggggcaaa gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag 3780
caagcacatt aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct 3840
gaccgattgg ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa 3900
ggacgagttc tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa 3960
gcccttcgcc attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta 4020
caactgcgcc ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat 4080
caattacttc aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc 4140
taacagattc tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa 4200
cttcaacttc gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg 4260
cagagagttc atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa 4320
tggcagagtg atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct 4380
gtttgtggcc ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat 4440
gaacctgatc ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc 4500
tgaaggatgc ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag 4560
aatcggcgag agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca 4620
gagaagagcc ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga 4680
catggtccga aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct 4740
gatcttcgag aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga 4800
gaggcagtac accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag 4860
caagacctac ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg 4920
cttcaccatc accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac 4980
cggctggatg accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta 5040
caacaggtac aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag 5100
cgaagagagc gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct 5160
gagcctgctg aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa 5220
ctgcggcttc gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct 5280
gttcctgaga agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga 5340
caagagggcc tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg 5400
gaagcccgcc gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga 5460
tgtccctgac tacgcttga 5479
<210> 964
<211> 5764
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP55 plasmid sequence
<400> 964
agccattgcc ttttatggta atcgtgcgag agggcgcagg gacttccttt gtcccaaatc 60
tgtgcggagc cgaaatctgg gaggcgccgc cgcaccccct ctagcgggcg cggggcgaag 120
cggtgcggcg ccggcaggaa ggaaatgggc ggggagggcc ttcgtgcgtc gccgcgccgc 180
cgtccccttc tccctctcca gcctcggggc tgtccgcggg gggacggctg ccttcggggg 240
ggacggggca gggcggggtt cggcttctgg cgtgtgaccg gcggctctag agcctctgct 300
aaccatgttc atgccttctt ctttttccta cagctcctgg gcaacgtgct ggttattgtg 360
ctgtctcatc attttggcaa agaattcgcc accatgagcc agccctccgc ttctggcagc 420
gccggcgccg gaggcgcccc tcagcaacct cctcctccac ctccccagcc cggacctgcc 480
gcccccgtgc ctagagccca gatcggttat ggagatctgg acgtgcttct gctgcaacag 540
gagtaccacc tcatcgatcc taatctgcaa gtgcaacacc tggacaccct gctggtgaga 600
atcacaggcg gaaactgggg ccctggcgat agattcgcca gaatcgaggt gctgctccgc 660
gacacactgg gccctctgca acagcctaga tacagatacg ccgccatgca gcaggccgac 720
ctgagaaacg acatcatcct gcacctgaac taccaggatg ccatcatcat cttcgacatg 780
atcatcccca gcgagggcgt gcaccggcac ggccctatgt ttgacggcct gtggatccac 840
ggcgacgact acagcatgaa cttccagcct atcacagccc acgagctgta cctgctgcct 900
cagcaggtgc tgaccgagga agtggaactg ctcaccgagg tgtgcaacag aatggccgat 960
tggatccggc ggcacaggtg tggcggagga agcggctcct ctcagccacc tcctccccca 1020
cctccagccg tgccagtgct gcctagtgcc cctccagcca gcagcctgcc cctgccccca 1080
cagggctggg gcatctctcc tcccgtggct accagcaccc ctggcgctgc cggacattct 1140
agcagcgccg gtcctaacat cagcctgggc ggcacctacg tgccccctcc tgtggctcct 1200
ccagcccctg tgatcggcgg ccctggcgga cccggacagc tgcctgctat ggtgcaggtg 1260
ctgcccgctc aacctgtcgt gatccccatt aacgtgatca gatctgtgtg cggcgataca 1320
cctagcaacc ctcaagacat ccctctgtgg atgggcagaa tcatccccgc cattgagggc 1380
gtctttccta ttgacaaccc caatctgaga atgagagtgg tgaacgccct gctggctctg 1440
catcctggcc tggctatcac cgaactgaat gcccagacat ggggccaggt tctggctgtg 1500
ctgcacatgc gggccctggg acacaccgcc ctgcaccagc tgcctgccct gctggaaaca 1560
atcgtgaaga ccgacggcat cctgccagct tataacatgg gcatggaagt tacacagcag 1620
gatttcagct acgtgtgggg catcctgcgg acactgttgc ccggccaagc cttcgtgctg 1680
agcatgcaga acgagctgga ccggctgcct gccgcccaga gacctggaat gttccccggc 1740
ctgctgcaga gaaccctgga tatcctgggc ctgaacagca gaggacagaa catccagaaa 1800
accaacaccc agcagcaggc cccaaagcgg ggccagaagc ctaagcccag actgccccca 1860
gtgcacagac ggcctgcacc cttcacccct cctgccaccc ccagccctcg gcagcaggcc 1920
agcgccagcc ccagcagcca gggcgacaac agaagccctc agcctcaggg cagaggcaca 1980
tacggcccga gccggggagg cggctctggc cctagataca acttccgtcc cagagtgcag 2040
cctcccgaca gatacggctt cggcagaggc cagggaggca gaagcagcat cggcgcccag 2100
gacaatcagc agcccggaca aggcggacag cggacccagc agaccaacca gaaccgcaac 2160
cagggcaacg ccaccggcgg tagaacccag cctcagaata gaacagtgaa caccgtgcgg 2220
gtgacccaga ccaatcctca aggcggctcc tccgtgtcca acccagctgt gacaacttct 2280
cagaatacag gaacaggaag tgcaactcag agctcatcat cttaaaggct ttgtggacac 2340
aggcagcagc atcacctgct tccccaagta caccctggtc gaggaagatc ctatcggcca 2400
gtacgacatc agcaccatcc acggcacagt gtcccagcct gtgtactaca tcaagttcaa 2460
ggtgaacggc aagaaagtgg aagccgaggt gaccgagtct ccactggact acgtgatcct 2520
gtgtcctagc gacgtgccct ggctgtctac aaagctggaa ctgacaatta agctgcctct 2580
gcaccagcag caacaggagc tgctgagcaa gaccagagtg aatcaaaaac agctgcagaa 2640
actctttatc cagtatgatg acctgtggca gaagtgggag aaccaggttg gacaccggaa 2700
gggtgccaga acagtgaaca ccgtgcgggt gggcggcagc ccaaagaaga agcggaaggt 2760
ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2820
cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2880
tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2940
cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 3000
agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 3060
agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 3120
gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 3180
gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 3240
taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 3300
tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3360
catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3420
tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3480
cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3540
ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3600
cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3660
cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3720
cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3780
ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3840
gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3900
gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3960
gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 4020
cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 4080
ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 4140
agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 4200
atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 4260
ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 4320
ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4380
cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4440
cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4500
ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4560
gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4620
gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4680
cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4740
ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4800
gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4860
caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4920
atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4980
cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 5040
gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 5100
aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 5160
caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 5220
cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 5280
catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 5340
gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5400
caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5460
gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5520
acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5580
agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5640
ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5700
tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5760
ttga 5764
<210> 965
<211> 5404
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP56 plasmid Sequence
<400> 965
atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60
ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120
accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180
gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240
cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300
gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360
gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420
gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480
ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540
atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600
agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660
cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720
tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780
gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840
gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900
gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960
ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020
gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080
ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140
cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200
caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260
ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320
cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380
aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440
acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500
cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560
ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620
ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680
accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740
gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800
ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860
aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920
gcttccagcg gagatcaaag gaactaaact gttagcccat tgggacagcg gcgccaccat 1980
tacatgcgtg cccgagtcct tcctggaaga tgagcagcct atcaaacaga ccctgatcaa 2040
gacaatccac ggcgagaagc agcagaaagt gtactacctg acctttaaga tcaagggaag 2100
aaaggtggaa gctgaagtga tcgccagccc ttacgagtac atcctgctgt ctccaacaga 2160
cgtgccttgg ctgacacagc aacctctgca gctgaccatc ctggtccccc tgcaggagta 2220
tcaggataga atcctcaaca agaccgccct gcctgaggaa cagaagcaaa gactgaagac 2280
cctgttcgcc aagtacgaca ccctgtggca gcactgggag aaccaggtgg gccaccggcg 2340
gggtgccaga gccgtcaaca cagtgaccca gggcggcagc ccaaagaaga agcggaaggt 2400
ctctagacaa gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa 2460
cacaaagaag gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc 2520
tgacctgaga gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat 2580
cagcaacacc agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa 2640
agccatcctg cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag 2700
agttgctcag cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga 2760
gaagggcaat ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt 2820
gtacaagctg gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg 2880
taacgtggcc gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc 2940
tgatgaggcc gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag 3000
catccacgtg accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa 3060
tagatacgcc tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc 3120
cagcttcctg agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa 3180
ccagaagaga ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag 3240
cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat 3300
cgccagagtg agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga 3360
cgacgccaag cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca 3420
ggccaatgaa gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa 3480
gaaagaggat ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct 3540
gaggccttac ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca 3600
gctgggcgac ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta 3660
cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct 3720
ggaagaggaa agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag 3780
agccaaggcc agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag 3840
atgcgagctg aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga 3900
ggccgagaac agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat 3960
ttggcagaaa gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg 4020
cggcaagctg cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac 4080
cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga 4140
ccccaacctg attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg 4200
gaacgatctg ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga 4260
gaaaaccctg tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac 4320
cttcgagaga agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt 4380
ggaccggggc gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact 4440
gagcagattc aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta 4500
caaagagaag cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg 4560
atactctagg aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac 4620
cgccagagat ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct 4680
gagcagaggc ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag 4740
aatggaagat tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc 4800
caaaacactg gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag 4860
cgccgactac gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac 4920
catcaacggc aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag 4980
gcagaacgtc gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa 5040
caacgacatc agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa 5100
gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac 5160
acacgccgat gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca 5220
agagtacaag aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt 5280
ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac 5340
tagtccaaaa aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc 5400
ttga 5404
<210> 966
<211> 5140
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP57 plasmid sequence
<400> 966
atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60
atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120
gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180
cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240
tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300
cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360
cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420
gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480
atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540
cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600
cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660
cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720
tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780
gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840
tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900
ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960
ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020
cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080
gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140
ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200
gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260
agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320
cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380
agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440
tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500
caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560
agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620
ctacaacaaa atgcaagccc tacagcctct ccaagtacaa atcaagggca acagccttaa 1680
gggattttat gataccggcg ccgagatcac ctgcgtgcca gccatcttcc tgatcgagga 1740
agagcctatc ggcgagcgga ccatccaaac aatccacggc atcacaaagg aaaaggtgta 1800
ctacctgacc tttaagatcc agggcagaaa gctggccgct gaagtgattg gaacccagct 1860
ggactacgtg atcatcgccc ctagcgacat cccctggtac aagaaatacg agctggaact 1920
gacaattaaa atcgacatcc agaaacagca ggagcagctg ctgcacacca ccaacctctc 1980
tagcgaggga aagaagtacc tgaaggacct gttcatcaag tatgataatc tgtggcagaa 2040
gtgggaaaac caggtcggcc acagaagagg tgccaacacc gtgcacaccg tgcggcaagt 2100
ggaatctggc ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat 2160
caacaagatc agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg 2220
ccccatgaaa accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa 2280
cctgagaaag aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct 2340
gaacaagctg ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga 2400
agagttccag aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa 2460
gatcgaccag aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg 2520
ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga 2580
gaaaggcaag gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct 2640
gattctgctg gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct 2700
gggcaagttt ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac 2760
acaccccgtg aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg 2820
caaagccctg tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga 2880
catcatcatc gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag 2940
ggagctggcc ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca 3000
cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa 3060
cctgaacctg tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact 3120
gaagggcttc cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga 3180
catggtctgc aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg 3240
gcagaacctg gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga 3300
ggaccggaag aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct 3360
ggaaaagaag cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga 3420
caagaaggtg gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga 3480
cgcccaatct aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga 3540
gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg 3600
gtacggcgat ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat 3660
cagcggcttc agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa 3720
actgaacctg tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat 3780
caaacccgag gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga 3840
gatcgtgccc atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct 3900
ggccttcggc aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac 3960
cggctctctg aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac 4020
cagacaggac gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga 4080
cagcagcaac atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc 4140
tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg 4200
caaccctaca cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca 4260
ggccaagaaa gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa 4320
ggccaagaat ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc 4380
cgtgacacag gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg 4440
caagagaacc tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa 4500
actggcctac gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc 4560
caagacctgc agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga 4620
aaagctcaag aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt 4680
tgagggccag atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag 4740
cgtggaactg gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa 4800
gggcagatca ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca 4860
agagaagttc gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct 4920
gaacattgcc agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa 4980
caagaccacc ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag 5040
aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt 5100
agccctcgag tacccatatg atgtccctga ctacgcttga 5140
<210> 967
<211> 4996
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP58 plasmid sequence
<400> 967
atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60
cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120
ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180
gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240
ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300
cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360
cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420
gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480
atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540
ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600
agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660
gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720
agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780
gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840
ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900
ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960
attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020
aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080
cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140
aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200
gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260
aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320
ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380
ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440
ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaatgga 1500
tctgctgaag ccgttgacgg tggaaagaaa gggggtaaag attaaaggtt actgggattc 1560
tcaggccgac atcacctgcg tgccaaagga cctgctgcag ggcgaggaac ccgtgcggca 1620
gcagaatgtg accaccatcc acggcaccca ggagggcgat gtctactacg tgaacctgaa 1680
gatcgacggc agaagaatca acaccgaggt gatcggcaca acactggact atgctatcat 1740
cacccctggc gacgtgcctt ggatcctgaa gaaacctctg gaactgacaa ttaagctgga 1800
tctggaagag caacaaggaa ccctgctcaa caacagcatc ctgagcaaga agggcaagga 1860
agagctgaaa cagctgttcg agaagtactc cgccctgtgg cagagctggg agaaccaggt 1920
gggacacaga cggggtgccg ccgccgtgca caccgtgaaa gccggcggca gcccaaagaa 1980
gaagcggaag gtctctagac aagagatcaa gagaatcaac aagatcagaa ggagactggt 2040
caaggacagc aacacaaaga aggccggcaa gacaggcccc atgaaaaccc tgctcgtcag 2100
agtgatgacc cctgacctga gagagcggct ggaaaacctg agaaagaagc ccgagaacat 2160
ccctcagcct atcagcaaca ccagcagggc caacctgaac aagctgctga ccgactacac 2220
cgagatgaag aaagccatcc tgcacgtgta ctgggaagag ttccagaaag accccgtggg 2280
cctgatgagc agagttgctc agcctgccag caagaagatc gaccagaaca agctgaagcc 2340
cgagatggac gagaagggca atctgaccac agccggcttt gcctgctctc agtgtggcca 2400
gcctctgttc gtgtacaagc tggaacaggt gtccgagaaa ggcaaggcct acaccaacta 2460
cttcggcaga tgtaacgtgg ccgagcacga gaagctgatt ctgctggccc agctgaaacc 2520
tgagaaggac tctgatgagg ccgtgaccta cagcctgggc aagtttggac agagagccct 2580
ggacttctac agcatccacg tgaccaaaga aagcacacac cccgtgaagc ccctggctca 2640
gatcgccggc aatagatacg cctctggacc tgtgggcaaa gccctgtccg atgcctgcat 2700
gggaacaatc gccagcttcc tgagcaagta ccaggacatc atcatcgagc accagaaggt 2760
ggtcaagggc aaccagaaga gactggaaag cctgagggag ctggccggca aagagaacct 2820
ggaatacccc agcgtgaccc tgcctcctca gcctcacaca aaagaaggcg tggacgccta 2880
caacgaagtg atcgccagag tgagaatgtg ggtcaacctg aacctgtggc agaagctgaa 2940
actgtccagg gacgacgcca agcctctgct gagactgaag ggcttcccta gcttccctct 3000
ggtggaaaga caggccaatg aagtggattg gtgggacatg gtctgcaacg tgaagaagct 3060
gatcaacgag aagaaagagg atggcaaggt tttctggcag aacctggccg gctacaagag 3120
acaagaagcc ctgaggcctt acctgagcag cgaagaggac cggaagaagg gcaagaagtt 3180
cgccagatac cagctgggcg acctgctgct gcacctggaa aagaagcacg gcgaggactg 3240
gggcaaagtg tacgatgagg cctgggagag aatcgacaag aaggtggaag gcctgagcaa 3300
gcacattaag ctggaagagg aaagaaggag cgaggacgcc caatctaaag ccgctctgac 3360
cgattggctg agagccaagg ccagctttgt gatcgagggc ctgaaagagg ccgacaagga 3420
cgagttctgc agatgcgagc tgaagctgca gaagtggtac ggcgatctga gaggcaagcc 3480
cttcgccatt gaggccgaga acagcatcct ggacatcagc ggcttcagca agcagtacaa 3540
ctgcgccttc atttggcaga aagacggcgt caagaaactg aacctgtacc tgatcatcaa 3600
ttacttcaaa ggcggcaagc tgcggttcaa gaagatcaaa cccgaggcct tcgaggctaa 3660
cagattctac accgtgatca acaaaaagtc cggcgagatc gtgcccatgg aagtgaactt 3720
caacttcgac gaccccaacc tgattatcct gcctctggcc ttcggcaaga gacagggcag 3780
agagttcatc tggaacgatc tgctgagcct ggaaaccggc tctctgaagc tggccaatgg 3840
cagagtgatc gagaaaaccc tgtacaacag gagaaccaga caggacgagc ctgctctgtt 3900
tgtggccctg accttcgaga gaagagaggt gctggacagc agcaacatca agcccatgaa 3960
cctgatcggc gtggaccggg gcgagaatat ccctgctgtg atcgccctga cagaccctga 4020
aggatgccca ctgagcagat tcaaggactc cctgggcaac cctacacaca tcctgagaat 4080
cggcgagagc tacaaagaga agcagaggac aatccaggcc aagaaagagg tggaacagag 4140
aagagccggc ggatactcta ggaagtacgc cagcaaggcc aagaatctgg ccgacgacat 4200
ggtccgaaac accgccagag atctgctgta ctacgccgtg acacaggacg ccatgctgat 4260
cttcgagaat ctgagcagag gcttcggccg gcagggcaag agaaccttta tggccgagag 4320
gcagtacacc agaatggaag attggctcac agctaaactg gcctacgagg gactgagcaa 4380
gacctacctg tccaaaacac tggcccagta tacctccaag acctgcagca attgcggctt 4440
caccatcacc agcgccgact acgacagagt gctggaaaag ctcaagaaaa ccgccaccgg 4500
ctggatgacc accatcaacg gcaaagagct gaaggttgag ggccagatca cctactacaa 4560
caggtacaag aggcagaacg tcgtgaagga tctgagcgtg gaactggaca gactgagcga 4620
agagagcgtg aacaacgaca tcagcagctg gacaaagggc agatcaggcg aggctctgag 4680
cctgctgaag aagaggttta gccacagacc tgtgcaagag aagttcgtgt gcctgaactg 4740
cggcttcgag acacacgccg atgaacaggc tgccctgaac attgccagaa gctggctgtt 4800
cctgagaagc caagagtaca agaagtacca gaccaacaag accaccggca acaccgacaa 4860
gagggccttt gtggaaacct ggcagagctt ctacagaaaa aagctgaaag aagtctggaa 4920
gcccgccgtg actagtccaa aaaagaagag aaaggtagcc ctcgagtacc catatgatgt 4980
ccctgactac gcttga 4996
<210> 968
<211> 5401
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP59 plasmid sequence
<400> 968
atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60
ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120
tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180
cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240
accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300
gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360
ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420
aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480
gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540
gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600
ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660
tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720
aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780
cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840
cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900
agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960
aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020
atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080
tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140
ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200
ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260
cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320
gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380
gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440
gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500
ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560
agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620
agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680
cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740
agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800
aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860
gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gacagcggag ccaccattac 1980
atgcatcccc gaggcttttc tggaagatga gcagcctatc caaacaatgc tgatcaagac 2040
catccacggc gagaagcagc agaacgtgta ctacctgaca ttcaagatcc agggcagaaa 2100
ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaatc cttctgatgt 2160
gccatggctg atgaaaaagc ctctgcaact gaccgtgctg gtccccctgc aggactacca 2220
ggagcggctg ctgaaacaga ccaccctgcc taaggaacag aaggaccagc tggaaaagct 2280
gttcctgaag tacgacgccc tgtggcagca ctgggagaac caggtgggcc acagaagagg 2340
tgccagaaca gtgaacaccg tgacaaccgg cggcagccca aagaagaagc ggaaggtctc 2400
tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460
aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520
cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580
caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640
catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700
tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760
gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820
caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880
cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940
tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000
ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060
atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120
cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180
gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240
gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300
cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360
cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420
caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480
agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540
gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600
gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660
tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720
agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780
caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840
cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900
cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960
gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020
caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080
gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140
caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200
cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260
aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320
cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380
ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440
cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500
agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560
ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620
cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680
cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740
ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800
aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860
cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920
caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980
gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040
cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100
gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160
cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220
gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280
aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340
tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400
a 5401
<210> 969
<211> 5401
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP60 plasmid sequence
<400> 969
atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60
ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120
tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180
cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240
accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300
ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360
ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420
gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480
gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540
gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600
ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660
tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720
aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780
cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840
cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900
agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960
aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020
atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080
tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140
ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200
ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260
cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320
gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380
gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440
ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500
caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560
ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620
cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680
cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740
cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800
aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860
accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaattaaa agcccactgg gatagcggag ctacaatcac 1980
ctgcgtgccc gaggcctttc tggaagatga gagacctatc cagaccatgc tgatcaagac 2040
catccacggc gagaagcagc aggacgtcta ctacctgacc ttcaaggtgc agggcagaaa 2100
ggtggaagcc gaggtgctgg cctctcctta tgactacatc ctgctcaacc ccagcgacgt 2160
gccttggctg atgaaaaagc ctctgcagct gacagtgctg gtgccactgc acgagtacca 2220
ggagcggctg ctgcaacaaa ccgccctgcc taaggaacag aaagagctgc tgcagaagct 2280
gttcctgaag tacgacgccc tgtggcagca ttgggaaaac caggtgggcc accggagagg 2340
tgccagatcc gtgaacaccg tgacagccgg cggcagccca aagaagaagc ggaaggtctc 2400
tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac 2460
aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga 2520
cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag 2580
caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc 2640
catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt 2700
tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa 2760
gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta 2820
caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa 2880
cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga 2940
tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat 3000
ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag 3060
atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag 3120
cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca 3180
gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt 3240
gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc 3300
cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga 3360
cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc 3420
caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa 3480
agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag 3540
gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct 3600
gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga 3660
tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga 3720
agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc 3780
caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg 3840
cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc 3900
cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg 3960
gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg 4020
caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt 4080
gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc 4140
caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa 4200
cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa 4260
aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt 4320
cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga 4380
ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag 4440
cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa 4500
agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata 4560
ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc 4620
cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag 4680
cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat 4740
ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa 4800
aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc 4860
cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat 4920
caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca 4980
gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa 5040
cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag 5100
gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca 5160
cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga 5220
gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga 5280
aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag 5340
tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg 5400
a 5401
<210> 970
<211> 5811
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP61 plasmid sequence
<400> 970
atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60
acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120
acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180
gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240
tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300
gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360
acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420
agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480
ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540
gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600
cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660
ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720
ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780
cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840
aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900
gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960
gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020
ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080
gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140
tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200
acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260
gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320
ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380
agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440
aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500
aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560
caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620
aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680
aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740
tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800
ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860
cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920
aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc ctgaaatggg 1980
gccccaagcg ttaagcactg gaatatatgg accactgcct cccaacactt ttggattaat 2040
cctaggccga agtagcatta ctatgaaggg tctacaagtt tatccaggag taattgataa 2100
tgactatacc ggagaaatta aaattatggc aaaagctgtt aacaatattg ttactgtctc 2160
tcaaggcaac agaatagctc aattaatcct cctgcctctg atcgagacag acaataaggt 2220
acaacaacct tatagaggac aaggaagttt tggatcctca gacatatatt gggtccaacc 2280
tattacttgt caaaaacctt ccttaacatt atggttagat gacaaaatgt tcacaggctt 2340
aatagatacg ggggctgatg tcacaattat caagctggag gactggcctc ctaattggcc 2400
tataacagat accttaacca atttaagagg aataggacaa agtaacaacc ctaaacaaag 2460
ttctaaatat cttacttgga gagataaaga aaacaattct ggtctcatca aaccgtttgt 2520
tattcctaac ttacctgtca atctttgggg ccgagattta ctttctcaaa tgaaaattat 2580
gatgtgtagc cccaatgaca tagtaactgc tcaaatgtta gcccagggct acagcccagg 2640
aaaagggtta ggaaaaaagg aaaatggcat tctacatcct atcccaaatc aaggacaatc 2700
taacaaaaaa ggttttggaa atttttaact gcggccattg acatacttgg tgccccacag 2760
gtgatggctg ctgtcgccgg cggcagccca aagaagaagc ggaaggtctc tagacaagag 2820
atcaagagaa tcaacaagat cagaaggaga ctggtcaagg acagcaacac aaagaaggcc 2880
ggcaagacag gccccatgaa aaccctgctc gtcagagtga tgacccctga cctgagagag 2940
cggctggaaa acctgagaaa gaagcccgag aacatccctc agcctatcag caacaccagc 3000
agggccaacc tgaacaagct gctgaccgac tacaccgaga tgaagaaagc catcctgcac 3060
gtgtactggg aagagttcca gaaagacccc gtgggcctga tgagcagagt tgctcagcct 3120
gccagcaaga agatcgacca gaacaagctg aagcccgaga tggacgagaa gggcaatctg 3180
accacagccg gctttgcctg ctctcagtgt ggccagcctc tgttcgtgta caagctggaa 3240
caggtgtccg agaaaggcaa ggcctacacc aactacttcg gcagatgtaa cgtggccgag 3300
cacgagaagc tgattctgct ggcccagctg aaacctgaga aggactctga tgaggccgtg 3360
acctacagcc tgggcaagtt tggacagaga gccctggact tctacagcat ccacgtgacc 3420
aaagaaagca cacaccccgt gaagcccctg gctcagatcg ccggcaatag atacgcctct 3480
ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa caatcgccag cttcctgagc 3540
aagtaccagg acatcatcat cgagcaccag aaggtggtca agggcaacca gaagagactg 3600
gaaagcctga gggagctggc cggcaaagag aacctggaat accccagcgt gaccctgcct 3660
cctcagcctc acacaaaaga aggcgtggac gcctacaacg aagtgatcgc cagagtgaga 3720
atgtgggtca acctgaacct gtggcagaag ctgaaactgt ccagggacga cgccaagcct 3780
ctgctgagac tgaagggctt ccctagcttc cctctggtgg aaagacaggc caatgaagtg 3840
gattggtggg acatggtctg caacgtgaag aagctgatca acgagaagaa agaggatggc 3900
aaggttttct ggcagaacct ggccggctac aagagacaag aagccctgag gccttacctg 3960
agcagcgaag aggaccggaa gaagggcaag aagttcgcca gataccagct gggcgacctg 4020
ctgctgcacc tggaaaagaa gcacggcgag gactggggca aagtgtacga tgaggcctgg 4080
gagagaatcg acaagaaggt ggaaggcctg agcaagcaca ttaagctgga agaggaaaga 4140
aggagcgagg acgcccaatc taaagccgct ctgaccgatt ggctgagagc caaggccagc 4200
tttgtgatcg agggcctgaa agaggccgac aaggacgagt tctgcagatg cgagctgaag 4260
ctgcagaagt ggtacggcga tctgagaggc aagcccttcg ccattgaggc cgagaacagc 4320
atcctggaca tcagcggctt cagcaagcag tacaactgcg ccttcatttg gcagaaagac 4380
ggcgtcaaga aactgaacct gtacctgatc atcaattact tcaaaggcgg caagctgcgg 4440
ttcaagaaga tcaaacccga ggccttcgag gctaacagat tctacaccgt gatcaacaaa 4500
aagtccggcg agatcgtgcc catggaagtg aacttcaact tcgacgaccc caacctgatt 4560
atcctgcctc tggccttcgg caagagacag ggcagagagt tcatctggaa cgatctgctg 4620
agcctggaaa ccggctctct gaagctggcc aatggcagag tgatcgagaa aaccctgtac 4680
aacaggagaa ccagacagga cgagcctgct ctgtttgtgg ccctgacctt cgagagaaga 4740
gaggtgctgg acagcagcaa catcaagccc atgaacctga tcggcgtgga ccggggcgag 4800
aatatccctg ctgtgatcgc cctgacagac cctgaaggat gcccactgag cagattcaag 4860
gactccctgg gcaaccctac acacatcctg agaatcggcg agagctacaa agagaagcag 4920
aggacaatcc aggccaagaa agaggtggaa cagagaagag ccggcggata ctctaggaag 4980
tacgccagca aggccaagaa tctggccgac gacatggtcc gaaacaccgc cagagatctg 5040
ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg agaatctgag cagaggcttc 5100
ggccggcagg gcaagagaac ctttatggcc gagaggcagt acaccagaat ggaagattgg 5160
ctcacagcta aactggccta cgagggactg agcaagacct acctgtccaa aacactggcc 5220
cagtatacct ccaagacctg cagcaattgc ggcttcacca tcaccagcgc cgactacgac 5280
agagtgctgg aaaagctcaa gaaaaccgcc accggctgga tgaccaccat caacggcaaa 5340
gagctgaagg ttgagggcca gatcacctac tacaacaggt acaagaggca gaacgtcgtg 5400
aaggatctga gcgtggaact ggacagactg agcgaagaga gcgtgaacaa cgacatcagc 5460
agctggacaa agggcagatc aggcgaggct ctgagcctgc tgaagaagag gtttagccac 5520
agacctgtgc aagagaagtt cgtgtgcctg aactgcggct tcgagacaca cgccgatgaa 5580
caggctgccc tgaacattgc cagaagctgg ctgttcctga gaagccaaga gtacaagaag 5640
taccagacca acaagaccac cggcaacacc gacaagaggg cctttgtgga aacctggcag 5700
agcttctaca gaaaaaagct gaaagaagtc tggaagcccg ccgtgactag tccaaaaaag 5760
aagagaaagg tagccctcga gtacccatat gatgtccctg actacgcttg a 5811
<210> 971
<211> 5077
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP62 plasmid sequence
<400> 971
atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60
gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120
tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180
tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240
aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300
ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360
tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420
aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480
gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540
actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600
catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660
aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720
cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780
ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840
ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900
tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960
actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020
accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080
gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140
cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggaggtttaa cctccccccc cacattacag caagtctttc 1320
ttaaccaaga cccagcatct attctgccag ttataccgtt agatcccgcc cgtcggcccg 1380
taattaaagc ccaggttgac acccagacca gccacccaaa gactatcgaa gctctactag 1440
atacaggagc agacatgaca gtccttccga tagccttgtt ctcaagtaat actcccctca 1500
aaaatacatc cgtattaggg gcagggggcc aaacccaaga tcactttaag ctcacctccc 1560
ttcctgtgct aatacgcctc cctttccgga caacgcctat tgttttaaca tcttgcctag 1620
ttgataccaa aaacaactgg gccatcatag gtcgcgatgc cttacaacaa tgccagggcg 1680
tcctgtacct ccctgaggca aaagggccgc ctgtaatctt gccaatacag gcgccagccg 1740
tccttggact agaacacctc ccaaggcccc cccaaatcag ccagttccct ttaaaccaga 1800
acgcctccag gccttgcaac acttggtccg gaaggccctg gaggcaggcc atatcgaatc 1860
ctacaccggg ccaggaaata acccagtatt cccagttaaa aaggccaatg gaacctggcg 1920
attcatccac gacctgcggg ccactaactc tctaaccata gacctctcat catcttcccc 1980
cgggccccct gacttgtcca gcctgccaac cacacgtgcc cctcaagtgc tgccagtgat 2040
gcacggcggc agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa 2100
caagatcaga aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc 2160
catgaaaacc ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct 2220
gagaaagaag cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa 2280
caagctgctg accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga 2340
gttccagaaa gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat 2400
cgaccagaac aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt 2460
tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa 2520
aggcaaggcc tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat 2580
tctgctggcc cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg 2640
caagtttgga cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca 2700
ccccgtgaag cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa 2760
agccctgtcc gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat 2820
catcatcgag caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga 2880
gctggccggc aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac 2940
aaaagaaggc gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct 3000
gaacctgtgg cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa 3060
gggcttccct agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat 3120
ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca 3180
gaacctggcc ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga 3240
ccggaagaag ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga 3300
aaagaagcac ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa 3360
gaaggtggaa ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc 3420
ccaatctaaa gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg 3480
cctgaaagag gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta 3540
cggcgatctg agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag 3600
cggcttcagc aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact 3660
gaacctgtac ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa 3720
acccgaggcc ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat 3780
cgtgcccatg gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc 3840
cttcggcaag agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg 3900
ctctctgaag ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag 3960
acaggacgag cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag 4020
cagcaacatc aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt 4080
gatcgccctg acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa 4140
ccctacacac atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc 4200
caagaaagag gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc 4260
caagaatctg gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt 4320
gacacaggac gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa 4380
gagaaccttt atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact 4440
ggcctacgag ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa 4500
gacctgcagc aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa 4560
gctcaagaaa accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga 4620
gggccagatc acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt 4680
ggaactggac agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg 4740
cagatcaggc gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga 4800
gaagttcgtg tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa 4860
cattgccaga agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa 4920
gaccaccggc aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa 4980
aaagctgaaa gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc 5040
cctcgagtac ccatatgatg tccctgacta cgcttga 5077
<210> 972
<211> 4871
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP63 plasmid sequence
<400> 972
atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60
ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120
ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180
ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240
actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300
aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360
acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420
ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480
gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540
tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600
caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660
ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720
actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780
ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840
ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900
agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960
caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020
atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080
aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140
gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200
ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260
acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320
tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380
gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440
cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500
tctctctttg gagaagacca gtagtcactg cctacattga agaacagccc gtagaagtat 1560
tattagatac aggggctgac gattcaattg tagcagggat agaattgggt ccaaattata 1620
cccctaaaat agtaggagga ataggaggct tcattaacac caaagaatat aaagatgtaa 1680
aaataaaagt cttaggcaag gtaattaagg gaacaattat gacgggagat accccaatta 1740
atatttttgg cagaaatttg ctaacagcta tgggcatgtc tttaaatctc cccatagcta 1800
aggtggaggg tgccggcggc aactaccccg tgcagcaagg cggcagccca aagaagaagc 1860
ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga ctggtcaagg 1920
acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc gtcagagtga 1980
tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag aacatccctc 2040
agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac tacaccgaga 2100
tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc gtgggcctga 2160
tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg aagcccgaga 2220
tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt ggccagcctc 2280
tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc aactacttcg 2340
gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg aaacctgaga 2400
aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga gccctggact 2460
tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg gctcagatcg 2520
ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc tgcatgggaa 2580
caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag aaggtggtca 2640
agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag aacctggaat 2700
accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac gcctacaacg 2760
aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag ctgaaactgt 2820
ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc cctctggtgg 2880
aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag aagctgatca 2940
acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac aagagacaag 3000
aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag aagttcgcca 3060
gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag gactggggca 3120
aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg agcaagcaca 3180
ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct ctgaccgatt 3240
ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac aaggacgagt 3300
tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc aagcccttcg 3360
ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag tacaactgcg 3420
ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc atcaattact 3480
tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag gctaacagat 3540
tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg aacttcaact 3600
tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag ggcagagagt 3660
tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc aatggcagag 3720
tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct ctgtttgtgg 3780
ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc atgaacctga 3840
tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac cctgaaggat 3900
gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg agaatcggcg 3960
agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa cagagaagag 4020
ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac gacatggtcc 4080
gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg ctgatcttcg 4140
agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc gagaggcagt 4200
acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg agcaagacct 4260
acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc ggcttcacca 4320
tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc accggctgga 4380
tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac tacaacaggt 4440
acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg agcgaagaga 4500
gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct ctgagcctgc 4560
tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg aactgcggct 4620
tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg ctgttcctga 4680
gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc gacaagaggg 4740
cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc tggaagcccg 4800
ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat gatgtccctg 4860
actacgcttg a 4871
<210> 973
<211> 4805
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP88 plasmid sequence
<400> 973
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800
aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860
gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920
cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980
ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040
agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100
gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160
acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220
tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280
gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340
actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400
acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460
gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520
tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580
gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640
ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700
tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760
gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820
gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880
agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940
ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000
accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060
tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120
agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180
tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240
gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300
ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360
tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420
aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480
acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540
acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600
tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660
tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720
tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780
gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840
cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900
gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960
gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020
acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080
atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140
ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200
tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260
ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320
ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380
agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440
tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500
agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560
agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620
gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680
ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740
tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800
acgct 4805
<210> 974
<211> 2413
<212> DNA
<213> Artificial Sequence
<220>
<223> pStx42.174.12.7 plasmid sequence
<400> 974
gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120
atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180
attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240
gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300
agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360
aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420
cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480
cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540
actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600
cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660
ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720
ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780
gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840
gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900
ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960
cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020
caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080
taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800
ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860
gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920
agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980
aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040
tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100
gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280
acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340
gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400
tttttttgaa ttc 2413
<210> 975
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 plasmid sequence
<400> 975
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 976
<211> 4794
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP127 plasmid sequence
<400> 976
atggaagccg tgatcaaggt gatcagctcc gcatgcaaga cctactgtgg caagacgagc 60
ccaagcaaga aggaaatcgg cgctatgctg agcctgctgc agaaggaggg cctcctgatg 120
agcctgtctg atctgtacag cccaggtagc tgggacccta tcaccgccgc cctgacacag 180
agagccatgg tgctgggcaa aagcggcgag ctgaagacat ggggactggt gctgggcgcc 240
ctgaaagccg ctagagaaga gcaagtaacc agcgagcagg ccaagttctg gctgggactg 300
ggcggcggta gagtgagccc ccctggccct gagtgcatcg agaagcctgc caccgagcgg 360
cgcattgaca aaggcgaaga agtgggcgag acaaccgtgc agagagacgc caagatggct 420
ccagaagaga cagcaacccc aaagaccgtg ggcaccagct gctaccactg cggcaccgct 480
atcggctgca actgcgccac cgccagcgcg cctcctcccc cgtatgtggg cagcggcctc 540
tacccctccc tggcaggagt gggagagcag cagggccagg gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggccagg cccctggccc cgccctgacc 660
gactgggcca gaatcagaga ggagctggcc tctacaggcc ctccagtggt cgccatgcct 720
gtggtgatca agaccgaggg acctgcctgg acccctctgg aacctaaact gattacacgg 780
ctggctgata ccgtcagaac caagggcctc agaagcccca tcacaatggc cgaagtggaa 840
gccctgatga gcagcccact gctgcctcac gacgtgacca acctgatgcg ggtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctggggcg tgcagctgca aacagttatc 960
gccgccgcca caagagaccc ccggcaccca gccaacggcc agggcagagg cgagagaaca 1020
aacctggatc ggctgaaggg cctcgccgat ggcatggccg gcaatcctga gggccaggct 1080
gctctgctga gacccgggga actggttgct atcaccgcca gcgccctgca ggccttcaga 1140
gaagtggccc ggctggccga gcctacagac ccctgggccg agatcaccca gggcccttct 1200
gagagcttcg tggacttcgc caacagactg atcaaggccg ttgagggctc cgacctgcct 1260
cctagcgccc gcgcccccgt gatcatcgac tgttttagac agaaatcgca acccgacatc 1320
cagcagctga tccgggccgc tccttctacc ctgaccacac ctggcgagat catcaagtac 1380
gtgctggaca gacagaagac cgcccccctg accgacagag gaatcgccgc cgccatgtct 1440
agcgccattc agcctctggt gatggccgtg gtcaacagag aaagagatgg acagacaggt 1500
tctggcggca gagcccgggg cctgtgctac acctgcggat cccctggaca ctaccaggcc 1560
cagtgtccta agaaaagaaa gtctggtaac agcagagagc ggtgccagct gtgtgatggc 1620
atgggccaca acgccaaaca gtgccggaga cgggacggaa accaaggaca aagacccggc 1680
cggggactga gcagcggacc ttggcctgtc agccagcaac ctgccgtgtc cggtgccacc 1740
agctgctacc actgcggcac cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1800
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1860
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1920
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1980
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2040
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2100
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2160
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2220
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2280
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2340
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2400
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2460
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2520
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2580
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2640
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2700
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2760
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2820
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2880
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2940
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3000
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3060
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3120
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3180
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3240
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3300
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3360
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3420
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3480
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3540
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3600
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3660
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3720
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3780
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3840
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3900
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3960
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4020
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4080
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4140
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4200
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4260
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4320
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4380
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4440
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4500
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4560
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4620
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4680
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4740
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4794
<210> 977
<211> 4320
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP128 plasmid sequence
<400> 977
atgggcaact ctcctagcta caatccccct gccggcatct ccccatctga ctggctgaac 60
ctgctgcagt ccgcccagcg cctgaatcca aggcctagcc catccgactt cacagatctg 120
aagaactata tccactggtt tcacaagacc cagaagaagc cttggacctt cacaagcgga 180
ggaccaacat cctgcccacc aggcagattt ggaagggtgc cactggtgct ggccaccctg 240
aacgaggtgc tgtccaatga gggaggagca cctggagcct ctgccccaga ggagcagcct 300
ccaccctacg accctccagc catcctgccc atcatctccg agggaaacag gaataggcac 360
agggcatggg cactgaggga gctgcaggat atcaagaagg agatcgagaa taaggcccct 420
ggctctcaag tgtggatcca gacactgcgg ctggccatcc tgcaggcaga cccaacccct 480
gcagatctgg agcagctgtg ccagtacatc gccagccctg tggaccagac cgcccacatg 540
acatccctga ccgcagcaat cgcagcagca gaggcagcaa cacccagcag agtgctgacc 600
cctaagaccg gcacactgac ccagcagtct gcccagccaa acgcaggcga tctgaggagc 660
cagtatcaga atctgtggct gcaggccggc aagatctccc tgctggtgct gcagctgcag 720
ccctggtcta ccatcgtgca gggacctgca gagagctccg tggagtttgt gaaccgcctg 780
cagatctccc tggccgacaa cctgccagat ggcgtgctgc ggaatcccct gctgacacct 840
ctggtcatgc agatgctgac cgagtctgtg agcaagttct gcaggggaga ggccagcgga 900
aggggaggag ccaagacagc aggactgaga accatcggac cacctaggat gaagcagcct 960
gccctgctgg tgcacacccc aggaccaaag atgcctggac cacgccagcc agcacctaag 1020
aggccaccac ctggaccttg ctacagatgt ctgaaggagg gacactgggc cagggactgc 1080
ccaacaaagg caaccggccc accacctgga ccatgcccca tctgtaagga cccaagccac 1140
tggaagcgcg attgtcccac actgaagtcc aagaatctaa tagagggggg acttagcgcc 1200
ccccaaacca taacacctat aacagattct cttagtgagg ccgaattaga atgcttaggt 1260
gccccagcca tcctgcccat catctccggc ggcagcccaa agaagaagcg gaaggtctct 1320
agacaagaga tcaagagaat caacaagatc agaaggagac tggtcaagga cagcaacaca 1380
aagaaggccg gcaagacagg ccccatgaaa accctgctcg tcagagtgat gacccctgac 1440
ctgagagagc ggctggaaaa cctgagaaag aagcccgaga acatccctca gcctatcagc 1500
aacaccagca gggccaacct gaacaagctg ctgaccgact acaccgagat gaagaaagcc 1560
atcctgcacg tgtactggga agagttccag aaagaccccg tgggcctgat gagcagagtt 1620
gctcagcctg ccagcaagaa gatcgaccag aacaagctga agcccgagat ggacgagaag 1680
ggcaatctga ccacagccgg ctttgcctgc tctcagtgtg gccagcctct gttcgtgtac 1740
aagctggaac aggtgtccga gaaaggcaag gcctacacca actacttcgg cagatgtaac 1800
gtggccgagc acgagaagct gattctgctg gcccagctga aacctgagaa ggactctgat 1860
gaggccgtga cctacagcct gggcaagttt ggacagagag ccctggactt ctacagcatc 1920
cacgtgacca aagaaagcac acaccccgtg aagcccctgg ctcagatcgc cggcaataga 1980
tacgcctctg gacctgtggg caaagccctg tccgatgcct gcatgggaac aatcgccagc 2040
ttcctgagca agtaccagga catcatcatc gagcaccaga aggtggtcaa gggcaaccag 2100
aagagactgg aaagcctgag ggagctggcc ggcaaagaga acctggaata ccccagcgtg 2160
accctgcctc ctcagcctca cacaaaagaa ggcgtggacg cctacaacga agtgatcgcc 2220
agagtgagaa tgtgggtcaa cctgaacctg tggcagaagc tgaaactgtc cagggacgac 2280
gccaagcctc tgctgagact gaagggcttc cctagcttcc ctctggtgga aagacaggcc 2340
aatgaagtgg attggtggga catggtctgc aacgtgaaga agctgatcaa cgagaagaaa 2400
gaggatggca aggttttctg gcagaacctg gccggctaca agagacaaga agccctgagg 2460
ccttacctga gcagcgaaga ggaccggaag aagggcaaga agttcgccag ataccagctg 2520
ggcgacctgc tgctgcacct ggaaaagaag cacggcgagg actggggcaa agtgtacgat 2580
gaggcctggg agagaatcga caagaaggtg gaaggcctga gcaagcacat taagctggaa 2640
gaggaaagaa ggagcgagga cgcccaatct aaagccgctc tgaccgattg gctgagagcc 2700
aaggccagct ttgtgatcga gggcctgaaa gaggccgaca aggacgagtt ctgcagatgc 2760
gagctgaagc tgcagaagtg gtacggcgat ctgagaggca agcccttcgc cattgaggcc 2820
gagaacagca tcctggacat cagcggcttc agcaagcagt acaactgcgc cttcatttgg 2880
cagaaagacg gcgtcaagaa actgaacctg tacctgatca tcaattactt caaaggcggc 2940
aagctgcggt tcaagaagat caaacccgag gccttcgagg ctaacagatt ctacaccgtg 3000
atcaacaaaa agtccggcga gatcgtgccc atggaagtga acttcaactt cgacgacccc 3060
aacctgatta tcctgcctct ggccttcggc aagagacagg gcagagagtt catctggaac 3120
gatctgctga gcctggaaac cggctctctg aagctggcca atggcagagt gatcgagaaa 3180
accctgtaca acaggagaac cagacaggac gagcctgctc tgtttgtggc cctgaccttc 3240
gagagaagag aggtgctgga cagcagcaac atcaagccca tgaacctgat cggcgtggac 3300
cggggcgaga atatccctgc tgtgatcgcc ctgacagacc ctgaaggatg cccactgagc 3360
agattcaagg actccctggg caaccctaca cacatcctga gaatcggcga gagctacaaa 3420
gagaagcaga ggacaatcca ggccaagaaa gaggtggaac agagaagagc cggcggatac 3480
tctaggaagt acgccagcaa ggccaagaat ctggccgacg acatggtccg aaacaccgcc 3540
agagatctgc tgtactacgc cgtgacacag gacgccatgc tgatcttcga gaatctgagc 3600
agaggcttcg gccggcaggg caagagaacc tttatggccg agaggcagta caccagaatg 3660
gaagattggc tcacagctaa actggcctac gagggactga gcaagaccta cctgtccaaa 3720
acactggccc agtatacctc caagacctgc agcaattgcg gcttcaccat caccagcgcc 3780
gactacgaca gagtgctgga aaagctcaag aaaaccgcca ccggctggat gaccaccatc 3840
aacggcaaag agctgaaggt tgagggccag atcacctact acaacaggta caagaggcag 3900
aacgtcgtga aggatctgag cgtggaactg gacagactga gcgaagagag cgtgaacaac 3960
gacatcagca gctggacaaa gggcagatca ggcgaggctc tgagcctgct gaagaagagg 4020
tttagccaca gacctgtgca agagaagttc gtgtgcctga actgcggctt cgagacacac 4080
gccgatgaac aggctgccct gaacattgcc agaagctggc tgttcctgag aagccaagag 4140
tacaagaagt accagaccaa caagaccacc ggcaacaccg acaagagggc ctttgtggaa 4200
acctggcaga gcttctacag aaaaaagctg aaagaagtct ggaagcccgc cgtgactagt 4260
ccaaaaaaga agagaaaggt agccctcgag tacccatatg atgtccctga ctacgcttga 4320
<210> 978
<211> 4407
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP129 plasmid sequence
<400> 978
atggtgtctc tggacaggga tatggcaagg caggtgagcg gaggcaagag ggattaccca 60
gagctggaga agtgcatcaa gcacgcctgt aagatcaagg tgcggctgag aggagagcac 120
ctgaccgagg gcaactgcct gtggtgtctg aagacactgg actatatgtt cgaggatcac 180
aaggaggagc cctggaccaa ggtgaagttt agaacaatct ggcagaaggt gaagaacctg 240
acccctgagg agagcaataa gaaggacttc atgtccctgc aggccacact ggccggcctg 300
atgtgctgtc agatgggcat gaggccagag accctgcagg acgccatggc cacagtgatc 360
atgaaggatg gcctgctgga gcaggaggag aagaaggagg ataagcgcga gaaggaggag 420
agcgtgtttc caatcgtggt gcaggcagca ggaggccggt cctggaaggc cgtggactct 480
gtgatgttcc agcagctgca gaccgtggca atgcagcacg gactggtgag cgaggatttt 540
gagagacagc tggcctacta tgccaccaca tggacatcca aggacatcct ggaggtgctg 600
gccatgatgc ccggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gccgagaggt ggcggagaaa caatccacct ccaccagcag gaggaggact gaccgtggat 720
cagatcatgg gagtgggaca gacaaaccag gcagcagcac aggcaaatat ggaccaggcc 780
agacagatct gcctgcagtg ggtcatcaac gcactgaggg ccgtgagaca catggcacac 840
aggcccggca accctatgct ggtgaagcag aagaccaatg agccttacga ggacttcgcc 900
gccagactgc tggaggccat cgatgccgag ccagtgacac agcccatcaa ggactacctg 960
aagctgaccc tgagctatac aaatgcctcc gccgactgcc agaagcagat ggatagaacc 1020
ctgggacaga gggtgcagca ggcctccgtg gaggagaaga tgcaggcctg tagggatgtg 1080
ggctctgagg gctttaagat gcagctgctg gcccaggccc tgaggcctgg caagggcaag 1140
ggaaacggac agccacagcg gtgctacaat tgtggcaagc caggacacca ggcaaggcag 1200
tgcaggcagg gcatcatatg tcacaactgt ggaaagagag gacatatgca aaaagaatgc 1260
agaggaaaga gagacataag gggaaaacag cagggaaacg ggaggagggg gatacgtgtg 1320
gtgccgtccg ctcctcctat ggaaggtgcc gcaggaggcc ggtcctggaa ggccggcggc 1380
agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1440
aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1500
ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1560
cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1620
accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 1680
gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 1740
aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 1800
cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 1860
tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 1920
cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 1980
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2040
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2100
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2160
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2220
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2280
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2340
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2400
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2460
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2520
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2580
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 2640
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 2700
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 2760
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 2820
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 2880
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 2940
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3000
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3060
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3120
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3180
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3240
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3300
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3360
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3420
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3480
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3540
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3600
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 3660
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 3720
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 3780
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 3840
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 3900
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 3960
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4020
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4080
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4140
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4200
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4260
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4320
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4380
ccatatgatg tccctgacta cgcttga 4407
<210> 979
<211> 4521
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP130 plasmid sequence
<400> 979
atgggcgatc ctctgacatg gagcaaggcc ctgaagaagc tggagaaggt gaccgtgcag 60
ggcagccaga agctgaccac aggcaactgc aattgggccc tgtccctggt ggacctgttc 120
cacgatacaa actttgtgaa ggagaaggat tggcagctgc gcgacgtgat cccactgctg 180
gaggacgtga cccagacact gtctggccag gagcgggagg ccttcgagag aacctggtgg 240
gccatcagcg ccgtgaagat gggcctgcag atcaacaatg tggtggatgg caaggcctct 300
tttcagctgc tgagggccaa gtacgagaag aagacagcca acaagaagca gtctgagcct 360
agcgaggagt atccaatcat gatcgacggc gccggcaacc ggaatttcag accactgacc 420
cccagaggct acaccacatg ggtgaacaca atccagacca acggcctgct gaatgaggcc 480
tcccagaatc tgttcggcat cctgagcgtg gattgtacct ccgaggagat gaatgccttt 540
ctggacgtgg tgccaggaca ggcaggacag aagcagatcc tgctggacgc catcgataag 600
atcgccgacg attgggataa ccggcaccca ctgcccaatg cacctctggt ggcaccacct 660
cagggaccta tcccaatgac agccaggttt atcaggggac tgggagtgcc acgggagaga 720
cagatggagc ccgccttcga ccagtttagg cagacctacc gccagtggat catcgaggcc 780
atgagcgagg gcatcaaagt gatgatcggc aagccaaagg cacagaacat caggcaggga 840
gccaaggagc cctatcctga gttcgtggat agactgctgt cccagatcaa gtctgagggc 900
caccctcagg agatctccaa gtttctgacc gacacactga ccatccagaa cgccaatgag 960
gagtgccgga atgccatgcg gcacctgaga ccagaggata ccctggagga gaagatgtac 1020
gcctgtagag acatcggcac cacaaagcag aagatgatgc tgctggccaa ggccctgcag 1080
acaggcctgg ccggaccatt caagggaggc gccctgaagg gcggccccct gaaggccgcc 1140
cagacctgct ataactgtgg caagccagga cacctgagct cccagtgcag ggcaccaaag 1200
gtgtgcttca agtgtaagca gcctggccac ttttctaagc aatgcagaag tgttccaaaa 1260
aacgggaagc aaggggctca agggaggccc cagaaacaaa ctttcccgat acaacagaag 1320
agtcagcaca acaaatctgt tgtacaagag actcctcaga ctcaaaatct gtacccagat 1380
ctgagcgaaa taaaaaagga atacaatgtc aaggagaagg atcaagtaga ggatctcaac 1440
ctggacagtt tgtgggaggg tgccagcgag gagtatccaa tcatgatcgg cggcagccca 1500
aagaagaagc ggaaggtctc tagacaagag atcaagagaa tcaacaagat cagaaggaga 1560
ctggtcaagg acagcaacac aaagaaggcc ggcaagacag gccccatgaa aaccctgctc 1620
gtcagagtga tgacccctga cctgagagag cggctggaaa acctgagaaa gaagcccgag 1680
aacatccctc agcctatcag caacaccagc agggccaacc tgaacaagct gctgaccgac 1740
tacaccgaga tgaagaaagc catcctgcac gtgtactggg aagagttcca gaaagacccc 1800
gtgggcctga tgagcagagt tgctcagcct gccagcaaga agatcgacca gaacaagctg 1860
aagcccgaga tggacgagaa gggcaatctg accacagccg gctttgcctg ctctcagtgt 1920
ggccagcctc tgttcgtgta caagctggaa caggtgtccg agaaaggcaa ggcctacacc 1980
aactacttcg gcagatgtaa cgtggccgag cacgagaagc tgattctgct ggcccagctg 2040
aaacctgaga aggactctga tgaggccgtg acctacagcc tgggcaagtt tggacagaga 2100
gccctggact tctacagcat ccacgtgacc aaagaaagca cacaccccgt gaagcccctg 2160
gctcagatcg ccggcaatag atacgcctct ggacctgtgg gcaaagccct gtccgatgcc 2220
tgcatgggaa caatcgccag cttcctgagc aagtaccagg acatcatcat cgagcaccag 2280
aaggtggtca agggcaacca gaagagactg gaaagcctga gggagctggc cggcaaagag 2340
aacctggaat accccagcgt gaccctgcct cctcagcctc acacaaaaga aggcgtggac 2400
gcctacaacg aagtgatcgc cagagtgaga atgtgggtca acctgaacct gtggcagaag 2460
ctgaaactgt ccagggacga cgccaagcct ctgctgagac tgaagggctt ccctagcttc 2520
cctctggtgg aaagacaggc caatgaagtg gattggtggg acatggtctg caacgtgaag 2580
aagctgatca acgagaagaa agaggatggc aaggttttct ggcagaacct ggccggctac 2640
aagagacaag aagccctgag gccttacctg agcagcgaag aggaccggaa gaagggcaag 2700
aagttcgcca gataccagct gggcgacctg ctgctgcacc tggaaaagaa gcacggcgag 2760
gactggggca aagtgtacga tgaggcctgg gagagaatcg acaagaaggt ggaaggcctg 2820
agcaagcaca ttaagctgga agaggaaaga aggagcgagg acgcccaatc taaagccgct 2880
ctgaccgatt ggctgagagc caaggccagc tttgtgatcg agggcctgaa agaggccgac 2940
aaggacgagt tctgcagatg cgagctgaag ctgcagaagt ggtacggcga tctgagaggc 3000
aagcccttcg ccattgaggc cgagaacagc atcctggaca tcagcggctt cagcaagcag 3060
tacaactgcg ccttcatttg gcagaaagac ggcgtcaaga aactgaacct gtacctgatc 3120
atcaattact tcaaaggcgg caagctgcgg ttcaagaaga tcaaacccga ggccttcgag 3180
gctaacagat tctacaccgt gatcaacaaa aagtccggcg agatcgtgcc catggaagtg 3240
aacttcaact tcgacgaccc caacctgatt atcctgcctc tggccttcgg caagagacag 3300
ggcagagagt tcatctggaa cgatctgctg agcctggaaa ccggctctct gaagctggcc 3360
aatggcagag tgatcgagaa aaccctgtac aacaggagaa ccagacagga cgagcctgct 3420
ctgtttgtgg ccctgacctt cgagagaaga gaggtgctgg acagcagcaa catcaagccc 3480
atgaacctga tcggcgtgga ccggggcgag aatatccctg ctgtgatcgc cctgacagac 3540
cctgaaggat gcccactgag cagattcaag gactccctgg gcaaccctac acacatcctg 3600
agaatcggcg agagctacaa agagaagcag aggacaatcc aggccaagaa agaggtggaa 3660
cagagaagag ccggcggata ctctaggaag tacgccagca aggccaagaa tctggccgac 3720
gacatggtcc gaaacaccgc cagagatctg ctgtactacg ccgtgacaca ggacgccatg 3780
ctgatcttcg agaatctgag cagaggcttc ggccggcagg gcaagagaac ctttatggcc 3840
gagaggcagt acaccagaat ggaagattgg ctcacagcta aactggccta cgagggactg 3900
agcaagacct acctgtccaa aacactggcc cagtatacct ccaagacctg cagcaattgc 3960
ggcttcacca tcaccagcgc cgactacgac agagtgctgg aaaagctcaa gaaaaccgcc 4020
accggctgga tgaccaccat caacggcaaa gagctgaagg ttgagggcca gatcacctac 4080
tacaacaggt acaagaggca gaacgtcgtg aaggatctga gcgtggaact ggacagactg 4140
agcgaagaga gcgtgaacaa cgacatcagc agctggacaa agggcagatc aggcgaggct 4200
ctgagcctgc tgaagaagag gtttagccac agacctgtgc aagagaagtt cgtgtgcctg 4260
aactgcggct tcgagacaca cgccgatgaa caggctgccc tgaacattgc cagaagctgg 4320
ctgttcctga gaagccaaga gtacaagaag taccagacca acaagaccac cggcaacacc 4380
gacaagaggg cctttgtgga aacctggcag agcttctaca gaaaaaagct gaaagaagtc 4440
tggaagcccg ccgtgactag tccaaaaaag aagagaaagg tagccctcga gtacccatat 4500
gatgtccctg actacgcttg a 4521
<210> 980
<211> 4674
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP131 plasmid sequence
<400> 980
atgggccaga cccacagcag acaactgttc gtgcacatgc tgtccgtgat gctgaagcac 60
agaggcatca ccgtgtctaa gcctaagctg atcaacttcc tgagcttcat cgaggaagtg 120
tgtccttggt ttccacggga aggcacagtg aacctggaaa catggaaaaa ggtgggcgaa 180
cagatcagaa cccactacac cctgcacggc cctgagaagg tgcctgtgga aacactttcc 240
ttctggaccc tgatccgcga ctgcctggat ttcgacaatg acgagctgaa aagactgggc 300
aacctgctca agcaggagga agatcctctg cacgaccctg acagcgagaa cagctacgac 360
gcccctcctc ctcctcatcc tagcctgcac tctagcagac cttccgacaa cgacgacctg 420
ctgtctagca cagacgaggc cgagctggac gaggaagccg ccaagtacca ccaggaggac 480
tggggcttcc tggctcagga gaaaggcgcc ctgacaagca aggacgagct ggtggaatgt 540
ttcaagaacc tgaccatcgc cctgcagaac gctggaatca agctgccagc caacaacgat 600
aagttcccct ccgccccccc tctgcctcct gcctacgccc ctagcgtggt ggccggactg 660
gatccacccc ccggccccct gcccccaagc aagaacatgt ctccactgca gaaagccctg 720
agacaagccc agaggctggg cgaagttgtg tccgatttca gcctggcctt ccccgtgttc 780
gagaacaaca accagcggta ctacgagagc ctgcctttca agcagctgaa ggaactcaaa 840
atcgcatgca gccagtacgg ccctaccgca ccttttacca tcgccatgat cgagaacctc 900
ggcacccagg ccctgccacc taatgattgg aagcagacag ccagagcctg cctgtcaggc 960
ggagattacc tgctgtggaa gagcgagttc ttcgagcaat gcgccagaat cgctgacgtg 1020
aaccggcagc agggcatcca gacgagctac gagatgctga tcggcgaggg accctaccag 1080
gccaccgaca cccagctgaa cttcctgcct ggggcctatg cccaaatcag caacgccgcc 1140
agacaggctt ggaagaaact gcctagctct tctacaaaga ccgaggacct gagcaaagtg 1200
cggcaaggcc ccgatgagcc ctaccaggac tttgtcgcca gactgctcga caccatcggc 1260
aagatcatga gcgacgaaaa ggccggcatg gtcctggcta agcaactggc tttcgagaat 1320
gctaatagcg cctgtcaggc cgccctgcgg ccttacagaa agaagggcga cctgtccgat 1380
tttatcagaa tctgcgccga catcggcccc tcttatatgc agggaattgc catggccgct 1440
gctctgcagg gcaaaagcat caaggaagtg cttttccagc agcaagctcg gaacaagcgg 1500
ggaagacaga gaagcggcaa tagcggttgt tttgtgtgcg gccagcccgg ccaccgcgcc 1560
gccgtgtgcc cccagaagca gcagagcccc gtgaacaccc ctaatctgtg cggtgccgac 1620
tgcctggatt tcgacaatga cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1680
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1740
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1800
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1860
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 1920
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 1980
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2040
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2100
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2160
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2220
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2280
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2340
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2400
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2460
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2520
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2580
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2640
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2700
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2760
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2820
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 2880
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 2940
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3000
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3060
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3120
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3180
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3240
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3300
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3360
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3420
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3480
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3540
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3600
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3660
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3720
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3780
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3840
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 3900
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 3960
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4020
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4080
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4140
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4200
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4260
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4320
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4380
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4440
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4500
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4560
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4620
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4674
<210> 981
<211> 4569
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP132 plasmid sequence
<400> 981
atgggccaga caatcacaac ccctctgagc ctgaccctgg accactggag tgaagtgcgg 60
gctagagccc acaaccaggg cgtggaagtc cggaaaaaaa agtggatcac cctgtgcgag 120
gccgagtggg tcatgatgaa cgtgggatgg cctagagagg gtacatttag cctggacaac 180
atcagccagg ttgagaaaaa gattttcgct cctggccctt acggccatcc tgaccaggtg 240
ccttacatca ccacatggcg gagcctggct accgacccac caagctgggt gcggcccttc 300
ctgcctcctc ccaagccccc cacccctctg cctcagcctc tgagccccca gccctctgcc 360
cctctgacca gctctctgta ccctgtgctg cctaagtccg atccccctaa acctcctgtt 420
ttacctcccg accctagcag cccactgatc gacctgctga cggaagaacc tcctccttat 480
cctggcggac atggcccccc accttctggc cctcggaccc caaccgcctc ccctatcgcc 540
tctagactga gagagcggag agaaaacccc gccgaagagt cccaagccct gcccctgaga 600
gagggcccta acaaccggcc tcagtactgg cccttcagcg ccagcgatct gtataactgg 660
aagtcccaca atcctccttt cagccaggat cctgtggccc tgacaaacct gatcgagtct 720
atcctggtga ctcaccagcc aacctgggat gactgccagc agctgctgca ggccctcctg 780
accggcgaag agagacagag agtgctgctg gaggccagaa agcaggtgcc tggagaggac 840
ggcaggccta cccagctgcc taatgtgatc gacgagacat tccccctgac cagaccaaat 900
tgggacttcg ccaccccagc tggcagagag cacctgcgcc tgtaccggca gcttctgctg 960
gccggactga gaggcgctgc cagaagacca accaacctgg ctcaggtgaa gcaggtcgtg 1020
cagggcaaag aggagacacc cgccgctttc ctggaacggc tgaaggaggc ctacagaatg 1080
tacacccctt acgaccccga agatccagga caggccgcca gcgtgatcct gagcttcatc 1140
taccagagca gccctgacat cagaaacaag ctgcagcggc tggaaggcct gcagggcttc 1200
acactgagcg acctgctcaa ggaggccgag aagatctaca acaagcggga aacccctgag 1260
gaaagagaag agagattgtg gcagcggcaa gaggagcggg acaaaaagcg gcacaaggaa 1320
atgaccaagg tgctggctac cgtggtggcc cagaacagag ataaagacag agaggaatcg 1380
aagctgggcg accagagaaa gatccccctt ggcaaggacc aatgtgccta ctgcaaggaa 1440
aaaggccact gggtgaggga ctgtcccaag agacccagaa agaagcccgc aaacagcaca 1500
ctgctgggtg ccagctctct gtaccctgtg ctgcctggcg gcagcccaaa gaagaagcgg 1560
aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1620
agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1680
acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1740
cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1800
aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1860
agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1920
gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1980
ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 2040
agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 2100
gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 2160
tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2220
ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2280
atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2340
ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2400
cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2460
gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2520
agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2580
agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2640
gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2700
gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2760
taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2820
gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2880
aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2940
ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 3000
tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 3060
attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 3120
ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3180
aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3240
tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3300
gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3360
atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3420
atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3480
ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3540
ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3600
ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3660
agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3720
ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3780
aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3840
aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3900
accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3960
ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 4020
accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 4080
accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 4140
aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4200
gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4260
aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4320
gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4380
agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4440
tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4500
gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4560
tacgcttga 4569
<210> 982
<211> 4410
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP133 plasmid sequence
<400> 982
atgggtcaga ttttcagcag aagcgcctcc cctattccta gacctccacg gggcctggcc 60
gcccaccact ggctgaattt cctgcaggcc gcttatagac tggagcctgg accttccagc 120
tacgacttcc accagctgaa gaaattcctg aagatcgccc tggaaacccc tgccagaatc 180
tgccctatca actacagcct gctggcctcc ctgctgccca agggctaccc tggcagagtg 240
aacgagatcc ttcatatcct gatccagaca caggctcaga tcccctctag gcccgctcca 300
cctcctccaa gcagcccaac ccacgatcct cctgatagcg accctcagat ccccccacca 360
tacgtggagc ccaccgcccc tcaagtgctg ccagtgatgc acccccacgg cgcccctcct 420
aatcacagac cttggcagat gaaagacctg caggccatca agcaggaagt gtcccaggcc 480
gctcctggca gcccccaatt tatgcagacc atcagactcg ccgttcagca gttcgacccc 540
acagccaagg atctgcagga cctgctgcag tacctgtgta gcagcctggt cgccagcctg 600
caccatcagc aactggattc tctgatcagc gaggccgaga caagaggcat caccggctac 660
aaccctctgg ccggccccct gcgggtgcag gcaaacaacc cccagcagca ggggctgcgg 720
agagagtacc agcagctgtg gctggctgct ttcgccgcac tgcctggaag cgccaaagat 780
ccatcttggg cctctatcct gcagggcctg gaagaacctt accacgcctt tgtggaaaga 840
ctgaacatcg ccctggacaa cggcctgcct gagggcaccc ctaaggaccc catcctgaga 900
tctctggcct acagcaacgc caacaaggaa tgtcagaagc tgctgcaagc cagaggccac 960
accaacagcc ccctgggcga catgctgcgc gcctgccaga cctggacccc taaggacaag 1020
accaaggtgc tggtggtgca gcctaagaag cctcccccta atcagccctg cttccggtgc 1080
ggcaaggccg gacactggag ccgggactgc acccagcctc ggcctccacc gggaccttgt 1140
cctctgtgcc aagaccccac acactggaag agagattgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggagggttta acctctcctc ctaccctgca gcaggtgttc 1320
ctgaatcaag atcctgccag catcctgggt gcccctcaag tgctgccagt gatgcacggc 1380
ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 1440
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 1500
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 1560
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 1620
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 1680
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 1740
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 1800
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 1860
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 1920
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 1980
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2040
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2100
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2160
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2220
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2280
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2340
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 2400
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 2460
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 2520
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 2580
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 2640
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 2700
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 2760
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 2820
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 2880
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 2940
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3000
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3060
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3120
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3180
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3240
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3300
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3360
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 3420
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 3480
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 3540
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 3600
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 3660
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 3720
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 3780
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 3840
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 3900
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 3960
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4020
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4080
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4140
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4200
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4260
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4320
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4380
tacccatatg atgtccctga ctacgcttga 4410
<210> 983
<211> 4407
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP134 plasmid sequence
<400> 983
atgggccaaa tcttttcccg tagcgctagc cctattccgc gaccgccccg ggggctggcc 60
gctcatcact ggcttaactt cctccaggcg gcatatcgcc tagaacccgg tccctccaat 120
tgcgctttcc acctgttaag aagatatcat gaaacagttt ccggaatacc ggctcggatc 180
tgtcccatta actactccct cctagccagc ctactcccaa aaggataccc cggccgggtg 240
aatgaaattt tacacatact catccaaacc caagcccaga tcccgtcccg tcccgcgcca 300
ccgccgccgt catcccccac ccacgacccc ccggattctg atccacaaat cccccctccc 360
tatgttgagc ctacggcccc ccaagtcctt ccagtcatgc atccacatgg tgctcctcct 420
aaccatcgcc catggcaaat gaaagaccta caggccatta agcaagaagt ctcccaagca 480
gcccctggga gcccccagtt tatgcagacc atccggcttg cggtgcagca gtttgacccc 540
actgccaaag acctccaaga cctcctgcag tacctttgct cctccctcgt ggcttccctc 600
catcaccagc agctagatag ccttatatca gaggccgaaa cccgaggtat tacaggttat 660
aacccattag ccggtcccct ccgtgtccaa gccaacaatc cacaacaaca aggattaagg 720
cgagaatacc agcaactctg gctcgccgcc ttcgccgccc tgccggggag tgccaaagac 780
ccttcctggg cctctatcct ccaaggcctg gaggagcctt accacgcctt cgtagaacgc 840
ctcaacatag ctcttgacaa tgggctgcca gaaggcacgc ccaaagaccc catcttacgt 900
tccttagcct actccaatgc aaacaaagaa tgccaaaaat tactacaggc ccgaggacac 960
actaatagcc ctctaggaga tatgttgcgg gcttgtcaga cctggacccc caaagacaaa 1020
accaaagtgt tagttgtcca gcctaaaaaa ccccccccaa atcagccgtg cttccggtgc 1080
gggaaagcag gccactggag tcgggactgc actcagcctc gtcccccccc cgggccatgc 1140
cccctatgtc aagacccaac tcactggaag cgagactgcc cccgcctaaa gcccactatc 1200
ccagaaccag agccagagga agatgccctc ctattagacc tccccgctga cattccacac 1260
ccaaaaaact ccataggggg ggaggtttta acctcccccc ccacattaca gcaagtcttt 1320
cttaaccaag acccagcatc tattctggcc cctcaagtgc tgccagtgat gcacggcggc 1380
agcccaaaga agaagcggaa ggtctctaga caagagatca agagaatcaa caagatcaga 1440
aggagactgg tcaaggacag caacacaaag aaggccggca agacaggccc catgaaaacc 1500
ctgctcgtca gagtgatgac ccctgacctg agagagcggc tggaaaacct gagaaagaag 1560
cccgagaaca tccctcagcc tatcagcaac accagcaggg ccaacctgaa caagctgctg 1620
accgactaca ccgagatgaa gaaagccatc ctgcacgtgt actgggaaga gttccagaaa 1680
gaccccgtgg gcctgatgag cagagttgct cagcctgcca gcaagaagat cgaccagaac 1740
aagctgaagc ccgagatgga cgagaagggc aatctgacca cagccggctt tgcctgctct 1800
cagtgtggcc agcctctgtt cgtgtacaag ctggaacagg tgtccgagaa aggcaaggcc 1860
tacaccaact acttcggcag atgtaacgtg gccgagcacg agaagctgat tctgctggcc 1920
cagctgaaac ctgagaagga ctctgatgag gccgtgacct acagcctggg caagtttgga 1980
cagagagccc tggacttcta cagcatccac gtgaccaaag aaagcacaca ccccgtgaag 2040
cccctggctc agatcgccgg caatagatac gcctctggac ctgtgggcaa agccctgtcc 2100
gatgcctgca tgggaacaat cgccagcttc ctgagcaagt accaggacat catcatcgag 2160
caccagaagg tggtcaaggg caaccagaag agactggaaa gcctgaggga gctggccggc 2220
aaagagaacc tggaataccc cagcgtgacc ctgcctcctc agcctcacac aaaagaaggc 2280
gtggacgcct acaacgaagt gatcgccaga gtgagaatgt gggtcaacct gaacctgtgg 2340
cagaagctga aactgtccag ggacgacgcc aagcctctgc tgagactgaa gggcttccct 2400
agcttccctc tggtggaaag acaggccaat gaagtggatt ggtgggacat ggtctgcaac 2460
gtgaagaagc tgatcaacga gaagaaagag gatggcaagg ttttctggca gaacctggcc 2520
ggctacaaga gacaagaagc cctgaggcct tacctgagca gcgaagagga ccggaagaag 2580
ggcaagaagt tcgccagata ccagctgggc gacctgctgc tgcacctgga aaagaagcac 2640
ggcgaggact ggggcaaagt gtacgatgag gcctgggaga gaatcgacaa gaaggtggaa 2700
ggcctgagca agcacattaa gctggaagag gaaagaagga gcgaggacgc ccaatctaaa 2760
gccgctctga ccgattggct gagagccaag gccagctttg tgatcgaggg cctgaaagag 2820
gccgacaagg acgagttctg cagatgcgag ctgaagctgc agaagtggta cggcgatctg 2880
agaggcaagc ccttcgccat tgaggccgag aacagcatcc tggacatcag cggcttcagc 2940
aagcagtaca actgcgcctt catttggcag aaagacggcg tcaagaaact gaacctgtac 3000
ctgatcatca attacttcaa aggcggcaag ctgcggttca agaagatcaa acccgaggcc 3060
ttcgaggcta acagattcta caccgtgatc aacaaaaagt ccggcgagat cgtgcccatg 3120
gaagtgaact tcaacttcga cgaccccaac ctgattatcc tgcctctggc cttcggcaag 3180
agacagggca gagagttcat ctggaacgat ctgctgagcc tggaaaccgg ctctctgaag 3240
ctggccaatg gcagagtgat cgagaaaacc ctgtacaaca ggagaaccag acaggacgag 3300
cctgctctgt ttgtggccct gaccttcgag agaagagagg tgctggacag cagcaacatc 3360
aagcccatga acctgatcgg cgtggaccgg ggcgagaata tccctgctgt gatcgccctg 3420
acagaccctg aaggatgccc actgagcaga ttcaaggact ccctgggcaa ccctacacac 3480
atcctgagaa tcggcgagag ctacaaagag aagcagagga caatccaggc caagaaagag 3540
gtggaacaga gaagagccgg cggatactct aggaagtacg ccagcaaggc caagaatctg 3600
gccgacgaca tggtccgaaa caccgccaga gatctgctgt actacgccgt gacacaggac 3660
gccatgctga tcttcgagaa tctgagcaga ggcttcggcc ggcagggcaa gagaaccttt 3720
atggccgaga ggcagtacac cagaatggaa gattggctca cagctaaact ggcctacgag 3780
ggactgagca agacctacct gtccaaaaca ctggcccagt atacctccaa gacctgcagc 3840
aattgcggct tcaccatcac cagcgccgac tacgacagag tgctggaaaa gctcaagaaa 3900
accgccaccg gctggatgac caccatcaac ggcaaagagc tgaaggttga gggccagatc 3960
acctactaca acaggtacaa gaggcagaac gtcgtgaagg atctgagcgt ggaactggac 4020
agactgagcg aagagagcgt gaacaacgac atcagcagct ggacaaaggg cagatcaggc 4080
gaggctctga gcctgctgaa gaagaggttt agccacagac ctgtgcaaga gaagttcgtg 4140
tgcctgaact gcggcttcga gacacacgcc gatgaacagg ctgccctgaa cattgccaga 4200
agctggctgt tcctgagaag ccaagagtac aagaagtacc agaccaacaa gaccaccggc 4260
aacaccgaca agagggcctt tgtggaaacc tggcagagct tctacagaaa aaagctgaaa 4320
gaagtctgga agcccgccgt gactagtcca aaaaagaaga gaaaggtagc cctcgagtac 4380
ccatatgatg tccctgacta cgcttga 4407
<210> 984
<211> 4677
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP135 plasmid sequence
<400> 984
atgggccaga ccgtgaccac acccctgtcc ctgacactgg gccactggaa ggacgtggag 60
cggatcgccc acaatcagtc tgtggatgtg aagaagcgga gatgggtgac cttctgcagc 120
gccgagtggc ccaccttcaa cgtgggctgg ccaagggacg gcaccttcaa ccgcgatctg 180
atcacacagg tgaagatcaa ggtgtttagc ccaggacctc acggacaccc agaccaggtg 240
ccttatatcg tgacctggga ggccctggcc ttcgatccac ctccatgggt gaagccattt 300
gtgcacccaa agccacctcc accactgcct ccatccgccc cttctctgcc actggagcca 360
cctcggtcca ccccaccaag aagctccctg tatcctgccc tgacaccatc tctgggcgcc 420
aagccaaagc cacaggtgct gtctgacagc ggaggacctc tgatcgacct gctgaccgag 480
gatcctccac cctacagaga tccaaggcct ccaccatccg acagggatgg aaacggagga 540
gaggcaacac cagcaggaga ggcccctgac ccatccccca tggcctctag actgaggggc 600
aggcgcgagc ctccagtggc agatagcacc acatcccagg cattcccact gagggcagga 660
ggaaatggcc agctgcagta ttggcccttt tctagctccg acctgtacaa ctggaagaac 720
aataacccat ccttctctga ggatcccggc aagctgaccg ccctgatcga gagcgtgctg 780
atcacccacc agcccacatg ggacgattgt cagcagctgc tgggcaccct gctgacaggc 840
gaggagaagc agcgggtgct gctggaggca aggaaggccg tgagaggcga cgatggcaga 900
cccacccagc tgcctaatga ggtggacgca gcatttccac tggagaggcc agactgggat 960
tataccacac aggccggcag gaaccacctg gtgcactaca ggcagctgct gctggccgga 1020
ctgcagaatg caggcaggtc ccctaccaac ctggccaagg tgaagggcat cacacagggc 1080
cctaatgaga gcccatccgc ctttctggag cgcctgaagg aggcctaccg gagatatacc 1140
ccctacgacc ctgaggatcc aggccaggag acaaacgtgt ctatgagctt catctggcag 1200
tctgccccag acatcggaag gaagctggag cgcctggagg acctgaagaa taagaccctg 1260
ggcgatctgg tgcgggaggc agagaagatc ttcaacaaga gagagacacc tgaggagagg 1320
gaggagcgga tcaggaggga gaccgaggag aaggaggagc ggagaaggac agaggacgag 1380
cagaaggaga aggagcggga tcgccggaga cacagagaga tgagcaagct gctggccacc 1440
gtggtgtccg gacagaagca ggacaggcag ggaggagaga ggcgccggtc tcagctggac 1500
cgcgatcagt gcgcctactg taaggagaag ggccactggg ccaaggattg ccccaagaag 1560
cctagaggcc caaggggccc taggccacag accagcctgc tgacactgga cgatggtgcc 1620
agctccctgt atcctgccct gacaggcggc agcccaaaga agaagcggaa ggtctctaga 1680
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 1740
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 1800
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 1860
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 1920
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 1980
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2040
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2100
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2160
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2220
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2280
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2340
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2400
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2460
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2520
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2580
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2640
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 2700
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 2760
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 2820
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 2880
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 2940
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3000
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3060
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3120
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3180
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3240
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3300
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3360
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3420
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3480
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3540
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3600
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3660
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 3720
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 3780
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 3840
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 3900
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 3960
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4020
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4080
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4140
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4200
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4260
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4320
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4380
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4440
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4500
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4560
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4620
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4677
<210> 985
<211> 5274
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP136 plasmid sequence
<400> 985
atgggcgtgt ccggctcaaa gggccagaag ctgtttgtgt ccgtgctgca gcgtctgctg 60
tccgaacggg gcctacacgt gaaagagagc agcgccatcg agttctacca gtttctgatc 120
aaggtgtcac cctggttccc cgaggaaggc ggcctgaatc tgcaggattg gaagagagtg 180
ggcagagaaa tgaagaagta cgccgctgag cacggcaccg acagcatccc caagcaggct 240
tatcctatct ggctgcaact gagagagatc ctgacagagc aatctgacct ggtgctgctg 300
agcgccgagg ccaagtccgt gacagaggaa gaactggaag aaggcctgac aggactgctg 360
agcgccagca gccaggagaa gacctacggc acaagaggca ccgcctatgc cgaaatcgac 420
accgaggtgg ataagctgag cgagcacatc tacgacgagc cctacgagga gaaggaaaag 480
gccgacaaga acgaggagaa ggaccacgtg cggaaggtca agaagatcgt gcaaagaaag 540
gaaaatagcg agcataagag aaaggagaaa gatcagaagg ccttcctggc aaccgactgg 600
aacaacgacg acctgagccc tgaggactgg gacgacctgg aagagcaggc cgcccactac 660
cacgatgacg acgaactgat cctgcctgtg aagagaaagg tggacaagaa gaagccgctc 720
gccctgaggc ggaaacctct gcccccggtt ggcttcgccg gagccatggc cgaggctaga 780
gagaagggcg atctgacctt cacatttccc gtggttttca tgggagaatc cgacgacgat 840
gatacccctg tgtgggaacc tctgcccctg aagacactga aggaactgca gtctgccgtg 900
cggaccatgg gccctagcgc cccttacacc ctccaggtgg tggacatggt tgcctctcag 960
tggctgacac ctagcgattg gcaccaaacc gccagagcca ccctgtctcc tggggactac 1020
gtgctgtggc ggaccgagta cgaggagaag agcaaggaaa ccgtgcagaa gaccgctggc 1080
aagcggaaag gcaaggtgag cctggatatg ctgctgggca caggtcagtt cctgagccct 1140
tcttctcaga tcaagctttc taaagatgtg ctgaaggatg tgaccaccaa cgccgtcctg 1200
gcctggagag ccatccctcc tccaggcgtc aaaaagacag tgctggccgg actcaagcag 1260
ggaaatgagg aaagctacga gacattcatc agcagactgg aagaggccgt gtacagaatg 1320
atgcctagag gagaaggcag cgacatcctg atcaagcagc tggcttggga gaacgctaat 1380
tctctgtgcc aggacctgat ccggcctatg cggaagaccg gcaccatgca ggactacatc 1440
agagcctgtc tggatgcctc ccctgccgtg gtgcagggca tggcctacgc cgccgcaatg 1500
agaggacaaa agtacagcac cttcgtgaaa cagacatacg gcggcggaaa aggcggacag 1560
ggctctgaag gccctgtgtg cttcagctgc ggcaaaacag gtcacattaa gcgggattgc 1620
aaggaagaga aaggaagcaa gcgcgctcct cctggactgt gtcctagatg caagaaaggc 1680
taccactgga agagcgagtg caagagcaag ttcgacaagg acggcaaccc tctgccacca 1740
ctggaaacta acgccgaaaa cagcaaaaac cccacacaga aaggcgacaa aggaaaggac 1800
agcggactga accccgaagc ccctcctttc accatccacg acctgccacg aggcacccca 1860
ggcagtgccg gcttggacct gagcagccag aaagacctga tcctgtctct ggaagacggc 1920
gtgtccctgg tgccaaccct ggtgaagggc accctgcccg agggcaccac gggactgatc 1980
atcggcagat ccagcaacta caagaaaggc ctggaggtgc tgcccggcgt gatcgactcc 2040
gacttccagg gcgaaattaa ggtcatggta aaggccgcta agaacgccgt gatcatccac 2100
aagggcgagc ggatcgcgca gctgctgctg ctgccttatc tgaaactgcc taaccctatc 2160
atcaaggagg aaagaggcag cgagggattt ggcagcacct cccacgtgca cggtgccgac 2220
ctggtgctgc tgagcgccga gggcggcagc ccaaagaaga agcggaaggt ctctagacaa 2280
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 2340
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 2400
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 2460
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2520
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2580
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2640
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2700
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2760
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2820
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2880
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2940
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 3000
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 3060
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 3120
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 3180
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 3240
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 3300
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 3360
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 3420
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3480
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3540
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3600
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3660
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3720
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3780
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3840
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3900
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3960
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 4020
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 4080
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 4140
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 4200
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 4260
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 4320
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 4380
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 4440
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4500
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4560
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4620
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4680
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4740
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4800
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4860
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4920
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4980
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 5040
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 5100
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 5160
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 5220
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5274
<210> 986
<211> 5034
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP137 plasmid sequence
<400> 986
atgggccagg agctgtccca gcacgagcgg tacgtggagc agctgaagca agcccttaaa 60
acaagaggcg tgaaggtgaa atacgccgac ctgctgaagt tcttcgattt tgtgaaggat 120
acctgccctt ggttccctca ggagggcacc atcgacatca agagatggcg cagagtgggc 180
gactgcttcc aagattacta caacaccttc ggacctgaga aagtgcctgt gaccgccttc 240
agctactgga acctgatcaa ggaactgatc gacaaaaagg aagtgaaccc acaggtgatg 300
gctgctgtcg cccagaccga ggaaatcctg aagagcaaca gccagacaga cctgaccaag 360
accagccaga accctgacct ggatctgatc agcctggaca gcgatgatga gggcgccaag 420
tccagcagcc tgcaggacaa gggcctgagc agcaccaaaa agcctaagcg gttccccgtc 480
ctgctgaccg cccagacaag caaggaccca gaggatccta acccaagcga ggtggactgg 540
gacggcctgg aggacgaggc cgctaagtac cacaaccctg actggccccc cttcctgaca 600
agacctccac cttacaacaa ggctacccct agcgccccta ccgtgatggc cgtggtgaac 660
cctaaagagg aactgaaaga aaagatcgcc cagctggaag agcagatcaa actggaagag 720
ctgcaccagg ccctgatttc taagctgcaa aagctgaaaa ccggcaacga gacagtcact 780
caccctgata cagccggagg cctgagcaga acaccacatt ggcccggcca gcacatccct 840
aagggcaagt gctgcgccag ccgggaaaag gaagagcaga tccccaagga tatcttccct 900
gtgaccgaaa ccgttgacgg acagggccag gcatggagac accacaatgg cttcgacttc 960
gccgtgatca aggaactgaa gacagccgcc tctcaatacg gcgccaccgc accttacacc 1020
ctggctatcg tggaatccgt cgccgacaac tggctgaccc caaccgactg gaataccctg 1080
gtgcgggccg tgctgtctgg cggcgaccac ctgctctgga agtctgagtt cttcgagaac 1140
tgtagggaca ccgctaagcg gaaccagcag gccggcaatg gatgggattt tgacatgctg 1200
accggcagcg gcaactacag ctctacagac gcccaaatgc agtacgaccc tggcctgttc 1260
gcccagattc aggccgctgc cacaaaggcc tggcggaagc tgcccgtgaa gggggatccc 1320
ggcgccagcc tgaccggcgt gaagcagggc cccgatgagc ctttcgccga cttcgtgcat 1380
agactgatca ccacagccgg cagaatcttc ggctccgccg aagccggcgt ggactacgtg 1440
aagcagctgg cttacgagaa cgccaaccct gcctgccagg ccgcaatcag accctataga 1500
aagaagacag atctgaccgg ctacatccgg ctgtgcagcg acatcggccc ttcctatcag 1560
cagggactgg ctatggccgc tgcctttagc ggccagaccg tgaaggactt cctgaacaac 1620
aagaacaagg aaaagggcgg atgttgtttt aagtgcggca agaaaggaca ctttgccaaa 1680
aactgccacg agcacgccca caacaacgcc gagcccaagg tgcccggcct gtgtcctcgg 1740
tgcaagagag gcaagcactg ggccaatgag tgcaagtcca agacagataa ccagggaaat 1800
ccaatccccc cccatcaggg aaatggtgct tctcctagac ctagaaacaa gctgatgggc 1860
caaagcgccc tgttccagcc taccaagaca acccacttca aggcctacca gagccacccc 1920
agaaagtgca gaatcggccc tctgttccac ctgccccaca gcatcaacgc cggtgcccca 1980
caggtgatgg ctgctgtcgc cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 2040
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 2100
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 2160
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 2220
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2280
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2340
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2400
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2460
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2520
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2580
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2640
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2700
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2760
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2820
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2880
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2940
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 3000
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 3060
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 3120
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 3180
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3240
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3300
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3360
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3420
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3480
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3540
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3600
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3660
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3720
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3780
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3840
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3900
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3960
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 4020
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 4080
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 4140
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 4200
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4260
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4320
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4380
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4440
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4500
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4560
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4620
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4680
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4740
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4800
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4860
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4920
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4980
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5034
<210> 987
<211> 5034
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP138 plasmid sequence
<400> 987
atggggcaag aattaagcca gcatgaacgt tatgtagaac aattgaagca ggctttaaag 60
acacggggag taaaggttaa atatgctgat cttttgaaat tttttgattt tgtgaaggat 120
acttgtcctt ggtttccgca agagggaacc atagatatta aacggtggcg tagagtaggc 180
gactgtttcc aagactatta caatactttt ggcccggaga aagtcccagt aactgcattc 240
tcttactgga acttaattaa agaattgata gataagaaag aagttaaccc acaagtaatg 300
gctgccgtag cccaaactga agaaatttta aaaagtaatt ctcaaacaga cctcacaaag 360
acctctcaaa acccagactt ggaccttatt tcccttgata gcgacgatga aggagctaaa 420
agttcctctc tacaagataa aggtttatca agtactaaaa aaccaaaaag attcccagtt 480
ctgttaacag cacaaactag taaagaccct gaagacccca acccctcaga ggtagactgg 540
gacggcttgg aagatgaggc agcgaaatat cataatcccg attggcctcc cttcctaacc 600
cgtccacctc cttacaataa agctactcct tccgcaccca ctgtaatggc ggttgttaat 660
ccaaaagagg agctcaaaga aaaaattgct caattagagg aacagattaa attagaagag 720
ttacaccagg cactaatttc caaattacaa aaactaaaaa cagggaatga aactgtaact 780
cacccagaca cagcaggagg cctttctcgc acgcctcact ggccagggca acatatccct 840
aaaggaaaat gttgcgccag tcgagaaaag gaagaacaaa tcccaaaaga tattttccca 900
gtgactgaaa ccgttgatgg gcaaggtcaa gcctggagac accataatgg ttttgatttt 960
gccgtcataa aagaattaaa aacagctgct tcccaatatg gggctactgc cccatacaca 1020
ttagccatag tggaatctgt agcggacaat tggcttaccc ctacagattg gaatacgctt 1080
gttagggcag tcctctcagg aggagatcac ttactgtgga aatctgagtt ttttgaaaat 1140
tgcagagata cggctaaaag aaaccaacaa gccggtaatg gctgggattt tgacatgtta 1200
acaggttcgg gtaattattc cagcaccgat gcacaaatgc agtatgatcc aggattgttt 1260
gctcaaattc aagcggctgc tacaaaagcc tggagaaaac ttcccgttaa gggagaccca 1320
ggagcctccc ttacaggagt caaacaagga cccgatgagc catttgcaga tttcgtacac 1380
agacttataa caactgctgg gagaatcttt ggaagtgctg aggccggtgt agactatgta 1440
aaacaactag catatgaaaa tgctaatcca gcttgtcagg cagccattcg cccctataga 1500
aagaagacag atttaactgg ctatatccgt ctttgctcgg atattgggcc ctcttatcag 1560
caaggcctgg ccatggccgc cgcctttagc gggcagactg taaaagattt tcttaacaac 1620
aaaaataaag agaaaggagg gtgttgcttt aaatgcggta aaaaaggaca ctttgcaaaa 1680
aattgtcatg aacatgcaca taacaatgct gaaccaaaag ttcccggact ctgccctaga 1740
tgtaaaagag ggaaacattg ggccaatgaa tgcaaatcca aaactgataa tcaaggaaac 1800
ccaataccac cccatcaggg aaacggggcc agccccaggc cccgaaacaa gcttatgggg 1860
cagtcagctt tgttccagcc aacaaaaaca acccatttca aagcttacca gagccacccc 1920
aggaagtgca ggattggacc tctgttccac ctcccacaca gtattaacgc cggtgcccca 1980
caggtgatgg ctgctgtcgc cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 2040
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 2100
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 2160
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 2220
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2280
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2340
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2400
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2460
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2520
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2580
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2640
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2700
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2760
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2820
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2880
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2940
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 3000
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 3060
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 3120
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 3180
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3240
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3300
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3360
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3420
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3480
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3540
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3600
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3660
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3720
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3780
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3840
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3900
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3960
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 4020
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 4080
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 4140
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 4200
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4260
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4320
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4380
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4440
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4500
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4560
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4620
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4680
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4740
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4800
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4860
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4920
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4980
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 5034
<210> 988
<211> 4794
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP139 plasmid sequence
<400> 988
atggaggccg tgatcaaggt gatcagcagc gcatgcaaga cctactgcgg caagaccagc 60
ccatctaaga aagagatcgg cgccatgctg agcctgctcc aaaaggaagg cctgctgatg 120
agcccttccg acctgtacag ccccggaagc tgggacccaa tcaccgctgc cctgacccag 180
cgggccatgg tgctgggaaa gagcggcgag ctgaagacct ggggcctggt gctgggagcc 240
ctgaaggccg ccagagagga acaagtgaca agcgaacagg ccaagttctg gctgggactg 300
ggcggaggaa gagtcagccc tcctggccca gagtgcatcg agaagcccgc tacagagaga 360
agaatcgata agggcgaaga ggtgggcgag acaacagtgc agagagacgc caagatggct 420
cctgaggaaa ccgccacacc taagaccgtg ggcacatctt gttaccactg cggcaccgcc 480
attggatgta actgcgctac agccagcgcc cccccccctc cctacgtggg cagcggactt 540
tatcctagcc tggccggcgt gggagagcag cagggccaag gcggagatac acccagaggc 600
gccgagcagc ctagagccga acccggccac gccggactgg cccctggccc agccctgacc 660
gactgggccc gcatccggga agaactggct tctaccggcc ccccggtggt cgccatgcct 720
gtggttatca agacagaggg ccctgcttgg acccctctgg aaccaaagct gattacaaga 780
ctcgccgaca ccgtgcggac caagggcctg cggagcccta tcaccatggc cgagatggaa 840
gctctgatga gcagcccact gctgccccac gacgtgacca acctgatgag agtgatcctg 900
ggccccgccc cttacgccct gtggatggac gcctgggggg tgcagctgca gaccgtgatt 960
gccgccgcca ccagagatcc tagacaccct gctaacggcc aaggcagagg cgaaagaacc 1020
aaccttgaca gactgaaagg cctggccgat ggaatggtcg gcaacagcga aggccaggcc 1080
gccctgctga gacctggcga gctggtggct atcacagcca gcgccctgca ggccttcaga 1140
gaagtggccc gactggctga gcccacggac ccttgggccg acatcatgca gggcccttct 1200
gagagcttcg tggacttcgc caatagactg atcaaggccg tcgagggcag cgatcttcct 1260
cctagcgcga gagcccctgt tatcatcgac tgcttccggc agaaaagcca gcccgacatc 1320
caacagctga tcagagccgc cccttccacc ctgaccacac caggcgagat catcaagtac 1380
gtgctggata gacagaagac cgcccctctg accgatcagg gcatcgccgc tgccatgtcc 1440
tctgccatcc agcctctggt gatggccgtg gtgaacagag agagagacgg ccagacaggc 1500
tccggcggcc gggccagaga gctgtgctac acctgtggct ctccaggcca ctaccaggct 1560
cagtgtccta aaaagcggaa gtctggcaat tctagagagc ggtgccagct gtgcaacggc 1620
atgggccata atgccaaaca gtgtcggaaa cgggacggaa accagggcca gagaccaggc 1680
agaggcctgt cttctggccc ctggcccggc cctgagcctc ctgctgtgtc cggtgccaca 1740
tcttgttacc actgcggcac cggcggcagc ccaaagaaga agcggaaggt ctctagacaa 1800
gagatcaaga gaatcaacaa gatcagaagg agactggtca aggacagcaa cacaaagaag 1860
gccggcaaga caggccccat gaaaaccctg ctcgtcagag tgatgacccc tgacctgaga 1920
gagcggctgg aaaacctgag aaagaagccc gagaacatcc ctcagcctat cagcaacacc 1980
agcagggcca acctgaacaa gctgctgacc gactacaccg agatgaagaa agccatcctg 2040
cacgtgtact gggaagagtt ccagaaagac cccgtgggcc tgatgagcag agttgctcag 2100
cctgccagca agaagatcga ccagaacaag ctgaagcccg agatggacga gaagggcaat 2160
ctgaccacag ccggctttgc ctgctctcag tgtggccagc ctctgttcgt gtacaagctg 2220
gaacaggtgt ccgagaaagg caaggcctac accaactact tcggcagatg taacgtggcc 2280
gagcacgaga agctgattct gctggcccag ctgaaacctg agaaggactc tgatgaggcc 2340
gtgacctaca gcctgggcaa gtttggacag agagccctgg acttctacag catccacgtg 2400
accaaagaaa gcacacaccc cgtgaagccc ctggctcaga tcgccggcaa tagatacgcc 2460
tctggacctg tgggcaaagc cctgtccgat gcctgcatgg gaacaatcgc cagcttcctg 2520
agcaagtacc aggacatcat catcgagcac cagaaggtgg tcaagggcaa ccagaagaga 2580
ctggaaagcc tgagggagct ggccggcaaa gagaacctgg aataccccag cgtgaccctg 2640
cctcctcagc ctcacacaaa agaaggcgtg gacgcctaca acgaagtgat cgccagagtg 2700
agaatgtggg tcaacctgaa cctgtggcag aagctgaaac tgtccaggga cgacgccaag 2760
cctctgctga gactgaaggg cttccctagc ttccctctgg tggaaagaca ggccaatgaa 2820
gtggattggt gggacatggt ctgcaacgtg aagaagctga tcaacgagaa gaaagaggat 2880
ggcaaggttt tctggcagaa cctggccggc tacaagagac aagaagccct gaggccttac 2940
ctgagcagcg aagaggaccg gaagaagggc aagaagttcg ccagatacca gctgggcgac 3000
ctgctgctgc acctggaaaa gaagcacggc gaggactggg gcaaagtgta cgatgaggcc 3060
tgggagagaa tcgacaagaa ggtggaaggc ctgagcaagc acattaagct ggaagaggaa 3120
agaaggagcg aggacgccca atctaaagcc gctctgaccg attggctgag agccaaggcc 3180
agctttgtga tcgagggcct gaaagaggcc gacaaggacg agttctgcag atgcgagctg 3240
aagctgcaga agtggtacgg cgatctgaga ggcaagccct tcgccattga ggccgagaac 3300
agcatcctgg acatcagcgg cttcagcaag cagtacaact gcgccttcat ttggcagaaa 3360
gacggcgtca agaaactgaa cctgtacctg atcatcaatt acttcaaagg cggcaagctg 3420
cggttcaaga agatcaaacc cgaggccttc gaggctaaca gattctacac cgtgatcaac 3480
aaaaagtccg gcgagatcgt gcccatggaa gtgaacttca acttcgacga ccccaacctg 3540
attatcctgc ctctggcctt cggcaagaga cagggcagag agttcatctg gaacgatctg 3600
ctgagcctgg aaaccggctc tctgaagctg gccaatggca gagtgatcga gaaaaccctg 3660
tacaacagga gaaccagaca ggacgagcct gctctgtttg tggccctgac cttcgagaga 3720
agagaggtgc tggacagcag caacatcaag cccatgaacc tgatcggcgt ggaccggggc 3780
gagaatatcc ctgctgtgat cgccctgaca gaccctgaag gatgcccact gagcagattc 3840
aaggactccc tgggcaaccc tacacacatc ctgagaatcg gcgagagcta caaagagaag 3900
cagaggacaa tccaggccaa gaaagaggtg gaacagagaa gagccggcgg atactctagg 3960
aagtacgcca gcaaggccaa gaatctggcc gacgacatgg tccgaaacac cgccagagat 4020
ctgctgtact acgccgtgac acaggacgcc atgctgatct tcgagaatct gagcagaggc 4080
ttcggccggc agggcaagag aacctttatg gccgagaggc agtacaccag aatggaagat 4140
tggctcacag ctaaactggc ctacgaggga ctgagcaaga cctacctgtc caaaacactg 4200
gcccagtata cctccaagac ctgcagcaat tgcggcttca ccatcaccag cgccgactac 4260
gacagagtgc tggaaaagct caagaaaacc gccaccggct ggatgaccac catcaacggc 4320
aaagagctga aggttgaggg ccagatcacc tactacaaca ggtacaagag gcagaacgtc 4380
gtgaaggatc tgagcgtgga actggacaga ctgagcgaag agagcgtgaa caacgacatc 4440
agcagctgga caaagggcag atcaggcgag gctctgagcc tgctgaagaa gaggtttagc 4500
cacagacctg tgcaagagaa gttcgtgtgc ctgaactgcg gcttcgagac acacgccgat 4560
gaacaggctg ccctgaacat tgccagaagc tggctgttcc tgagaagcca agagtacaag 4620
aagtaccaga ccaacaagac caccggcaac accgacaaga gggcctttgt ggaaacctgg 4680
cagagcttct acagaaaaaa gctgaaagaa gtctggaagc ccgccgtgac tagtccaaaa 4740
aagaagagaa aggtagccct cgagtaccca tatgatgtcc ctgactacgc ttga 4794
<210> 989
<211> 4584
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP140 plasmid sequence
<400> 989
atgggcgcca ggaacagcgt gctgtccggc aaggaggccg atgagctgga gaaggtgcgg 60
ctgagaccca atggcaagaa gaagtacatg ctgaagcacg tggtgtgggc agcaaacgag 120
ctggaccgct tcggcctggc cgagtctctg ctggataata aggagggctg ccagaagatc 180
ctgagcgtgc tggcccctct ggtgccaacc ggctctgaga acctgaagag cctgtataat 240
acagtgtgcg tgatctggtg tatccacgcc gaggagaagg tgaagcacac cgaggaggcc 300
aagcagatcg tgcagaggca cctggtggtg gagaccggca cagcagatag gatgccagcc 360
accagccgcc caacagcacc accttccgga aggggcggca actaccccgt gcagcaagtg 420
ggcggcaatt atgtgcacct gcccctgagc cctagaaccc tgaacgcctg ggtgaagctg 480
gtggaggaga agaagttcgg agcagaggtg gtgccaggat ttcaggccct gtccgagggc 540
tgcacaccct acgacatcaa ccagatgctg aattgcgtgg gagagcacca ggcagcaatg 600
cagatcatcc gggagatcat caacgaggag gcagcagact gggatctgca gcaccctcag 660
ccaggaccac tgcctgcagg acagctgcgg gagcctagag gctctgacat cgccggcacc 720
acaagcaccg tggatgagca gatccagtgg atgtacaggc agcagaaccc aatccccgtg 780
ggcaatatct atcggagatg gatccagctg ggcctgcaga agtgcgtgcg gatgtataac 840
ccaaccaata tcctggacgt gaagcagggc ccaaaggagc ccttccagag ctacgtggac 900
agattctaca agtccctgag agccgagcag acagatcccg ccgtgaagaa ctggatgacc 960
cagacactgc tgatccagaa cgccaatccc gattgcaagc tggtgctgaa gggcctgggc 1020
atgaatccta ccctggagga gatgctgaca gcatgtcagg gagtgggagg acctggacag 1080
aaggcaaggc tgatggcaga ggccctgaag gaggccctga ggcctgacca gctgccattt 1140
gccgccgtgc agcagaaggg ccagaggaag accatcaagt gctggaactg tggcaaggag 1200
ggacactctg ccaagcagtg cagggcacca aggcgccagg gatgctggaa gtgtggcaag 1260
acaggccacg tgatggccaa gtgtcctgag aggcaggcag gcttcctggg actgggacca 1320
tggggcaaga agccaagaaa ttttcctatg gcccagatgc ctcagggact gatcccaacc 1380
gcaccaccag aggacccagc agtggatctg ctgaagaact acatgaagat gggcaggaag 1440
cagcgcgaga atagggagcg cccttataag gaggtgacag aggacctgct gcacctgaac 1500
tctctctttg gagaagacca gggtgccggc ggcaactacc ccgtgcagca aggcggcagc 1560
ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 1620
agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 1680
ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 1740
gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 1800
gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 1860
cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 1920
ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 1980
tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2040
accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2100
ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2160
agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2220
ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2280
gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 2340
cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 2400
gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 2460
gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 2520
aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 2580
ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 2640
aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 2700
tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 2760
aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 2820
gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 2880
ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 2940
gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3000
gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3060
ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3120
cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3180
atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3240
gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3300
gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 3360
cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 3420
gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 3480
gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 3540
cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 3600
gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 3660
ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 3720
gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 3780
gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 3840
atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 3900
gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 3960
ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4020
tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4080
gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4140
tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4200
ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4260
gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4320
ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 4380
tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 4440
accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 4500
gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 4560
tatgatgtcc ctgactacgc ttga 4584
<210> 990
<211> 4584
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP141 plasmid sequence
<400> 990
atgggcgcga gaaactccgt cttgtcaggg aaggaagcag atgaattaga aaaagttagg 60
ttacggccca acggaaagaa aaagtatatg ttgaagcatg tagtatgggc agcaaatgaa 120
ttggacagat ttggattagc agaaagcctg ttggataaca aagaaggttg tcaaaaaatt 180
ctttcagttt tagctccatt agttccgaca ggttcagaaa acttaaagag cctttataat 240
actgtctgcg tcatttggtg cattcacgca gaagagaaag tgaaacatac tgaggaagca 300
aaacaaatag tgcagagaca tctagtggtg gaaacaggaa cagcagacag aatgccagca 360
acaagcagac caacagcacc acctagtggc agaggaggaa attacccagt gcagcaagta 420
ggtggcaatt atgtccacct acccttaagt ccaagaacat taaatgcttg ggtaaaatta 480
gtagaagaga aaaaatttgg ggcagaggta gtgccaggat ttcaagcgct atcagaaggc 540
tgcactccct atgatattaa tcaaatgcta aattgtgtag gagaacatca ggcagccatg 600
caaattatta gagagattat aaatgaagaa gctgccgatt gggatttaca acacccgcaa 660
ccaggtccac taccagcagg gcaacttaga gagccaagag gatcagacat tgcaggaact 720
actagtacag tagatgaaca aatccaatgg atgtacaggc aacaaaaccc cataccagta 780
ggcaacattt atagaaggtg gatccaatta gggctgcaga aatgtgtaag aatgtataac 840
ccaacaaaca ttttagatgt gaaacaagga ccaaaagagc catttcaaag ctacgtagat 900
agattctaca aaagtctaag agcagagcaa acagatcccg cagtaaagaa ttggatgacc 960
caaacactgc tgattcaaaa tgctaaccca gattgtaaac tagtgctcaa gggtctgggc 1020
atgaatccca ctttagaaga aatgctgaca gcctgtcagg gagtaggagg gccaggacaa 1080
aaagctaggt taatggcaga agcattgaaa gaggcactga ggccagatca actcccattt 1140
gcagcagtcc aacagaaagg acaaaggaag acaatcaagt gttggaattg tggaaaggag 1200
ggacactctg caaaacaatg cagggcccct agaagacagg gctgctggaa gtgtggaaaa 1260
acgggtcatg ttatggccaa atgccctgaa agacaggcgg gttttttagg gcttggccca 1320
tggggaaaga agccccgcaa tttccccatg gcccagatgc ctcaggggct gataccaact 1380
gctcccccag aggatccagc tgtggatcta ctgaagaatt acatgaagat gggcagaaag 1440
cagagggaga acagagagag accttacaag gaggtgacag aggatttgct gcacctcaat 1500
tctctctttg gagaagacca gggtgccggc ggcaactacc ccgtgcagca aggcggcagc 1560
ccaaagaaga agcggaaggt ctctagacaa gagatcaaga gaatcaacaa gatcagaagg 1620
agactggtca aggacagcaa cacaaagaag gccggcaaga caggccccat gaaaaccctg 1680
ctcgtcagag tgatgacccc tgacctgaga gagcggctgg aaaacctgag aaagaagccc 1740
gagaacatcc ctcagcctat cagcaacacc agcagggcca acctgaacaa gctgctgacc 1800
gactacaccg agatgaagaa agccatcctg cacgtgtact gggaagagtt ccagaaagac 1860
cccgtgggcc tgatgagcag agttgctcag cctgccagca agaagatcga ccagaacaag 1920
ctgaagcccg agatggacga gaagggcaat ctgaccacag ccggctttgc ctgctctcag 1980
tgtggccagc ctctgttcgt gtacaagctg gaacaggtgt ccgagaaagg caaggcctac 2040
accaactact tcggcagatg taacgtggcc gagcacgaga agctgattct gctggcccag 2100
ctgaaacctg agaaggactc tgatgaggcc gtgacctaca gcctgggcaa gtttggacag 2160
agagccctgg acttctacag catccacgtg accaaagaaa gcacacaccc cgtgaagccc 2220
ctggctcaga tcgccggcaa tagatacgcc tctggacctg tgggcaaagc cctgtccgat 2280
gcctgcatgg gaacaatcgc cagcttcctg agcaagtacc aggacatcat catcgagcac 2340
cagaaggtgg tcaagggcaa ccagaagaga ctggaaagcc tgagggagct ggccggcaaa 2400
gagaacctgg aataccccag cgtgaccctg cctcctcagc ctcacacaaa agaaggcgtg 2460
gacgcctaca acgaagtgat cgccagagtg agaatgtggg tcaacctgaa cctgtggcag 2520
aagctgaaac tgtccaggga cgacgccaag cctctgctga gactgaaggg cttccctagc 2580
ttccctctgg tggaaagaca ggccaatgaa gtggattggt gggacatggt ctgcaacgtg 2640
aagaagctga tcaacgagaa gaaagaggat ggcaaggttt tctggcagaa cctggccggc 2700
tacaagagac aagaagccct gaggccttac ctgagcagcg aagaggaccg gaagaagggc 2760
aagaagttcg ccagatacca gctgggcgac ctgctgctgc acctggaaaa gaagcacggc 2820
gaggactggg gcaaagtgta cgatgaggcc tgggagagaa tcgacaagaa ggtggaaggc 2880
ctgagcaagc acattaagct ggaagaggaa agaaggagcg aggacgccca atctaaagcc 2940
gctctgaccg attggctgag agccaaggcc agctttgtga tcgagggcct gaaagaggcc 3000
gacaaggacg agttctgcag atgcgagctg aagctgcaga agtggtacgg cgatctgaga 3060
ggcaagccct tcgccattga ggccgagaac agcatcctgg acatcagcgg cttcagcaag 3120
cagtacaact gcgccttcat ttggcagaaa gacggcgtca agaaactgaa cctgtacctg 3180
atcatcaatt acttcaaagg cggcaagctg cggttcaaga agatcaaacc cgaggccttc 3240
gaggctaaca gattctacac cgtgatcaac aaaaagtccg gcgagatcgt gcccatggaa 3300
gtgaacttca acttcgacga ccccaacctg attatcctgc ctctggcctt cggcaagaga 3360
cagggcagag agttcatctg gaacgatctg ctgagcctgg aaaccggctc tctgaagctg 3420
gccaatggca gagtgatcga gaaaaccctg tacaacagga gaaccagaca ggacgagcct 3480
gctctgtttg tggccctgac cttcgagaga agagaggtgc tggacagcag caacatcaag 3540
cccatgaacc tgatcggcgt ggaccggggc gagaatatcc ctgctgtgat cgccctgaca 3600
gaccctgaag gatgcccact gagcagattc aaggactccc tgggcaaccc tacacacatc 3660
ctgagaatcg gcgagagcta caaagagaag cagaggacaa tccaggccaa gaaagaggtg 3720
gaacagagaa gagccggcgg atactctagg aagtacgcca gcaaggccaa gaatctggcc 3780
gacgacatgg tccgaaacac cgccagagat ctgctgtact acgccgtgac acaggacgcc 3840
atgctgatct tcgagaatct gagcagaggc ttcggccggc agggcaagag aacctttatg 3900
gccgagaggc agtacaccag aatggaagat tggctcacag ctaaactggc ctacgaggga 3960
ctgagcaaga cctacctgtc caaaacactg gcccagtata cctccaagac ctgcagcaat 4020
tgcggcttca ccatcaccag cgccgactac gacagagtgc tggaaaagct caagaaaacc 4080
gccaccggct ggatgaccac catcaacggc aaagagctga aggttgaggg ccagatcacc 4140
tactacaaca ggtacaagag gcagaacgtc gtgaaggatc tgagcgtgga actggacaga 4200
ctgagcgaag agagcgtgaa caacgacatc agcagctgga caaagggcag atcaggcgag 4260
gctctgagcc tgctgaagaa gaggtttagc cacagacctg tgcaagagaa gttcgtgtgc 4320
ctgaactgcg gcttcgagac acacgccgat gaacaggctg ccctgaacat tgccagaagc 4380
tggctgttcc tgagaagcca agagtacaag aagtaccaga ccaacaagac caccggcaac 4440
accgacaaga gggcctttgt ggaaacctgg cagagcttct acagaaaaaa gctgaaagaa 4500
gtctggaagc ccgccgtgac tagtccaaaa aagaagagaa aggtagccct cgagtaccca 4560
tatgatgtcc ctgactacgc ttga 4584
<210> 991
<211> 4389
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP142 plasmid sequence
<400> 991
atggccaagc agggctccaa ggagaagaag ggctaccccg agctgaagga agtgatcaag 60
gcaacctgca agatcagggt gggacctggc aaggagaccc tgacagaggg caactgtctg 120
tgggccctga agacaatcga cttcatcttt gaggatctga agaccgagcc atggaccatc 180
acaaagatgt atacagtgtg ggatcggctg aagggactga ccccagagga gacatccaag 240
agagagttcg cctctctgca ggccaccctg gcctgcatca tgtgctccca gatgggcatg 300
aagcctgaga cagtgcaggc cgccaagggc atcatctcta tgaaggaggg cctgcacgag 360
aataaggagg ccaagggcga gaaggtggag cagctgtacc ctaacctgga gaagcacagg 420
gaggtgtatc caatcgtgaa tctgcaggca ggaggccgca gctggaaggc agtggagtcc 480
gtggtgttcc agcagctgca gaccgtggcc atgcagcacg gcctggtgtc tgaggacttt 540
gagcggcagc tggcctacta tgccaccaca tggacaagca aggatatcct ggaggtgctg 600
gccatgatgc caggcaacag agcccagaag gagctgatcc agggcaagct gaatgaggag 660
gcagagcggt gggtgagaca gaacccacct ggacccaatg tgctgaccgt ggaccagatc 720
atgggcgtgg gccagacaaa ccagcaggcc agccaggcca atatggatca ggccaggcag 780
atctgcctgc agtgggtcat caccgccctg aggagcgtgc gccacatgtc ccacaggcct 840
ggaaacccaa tgctggtgaa gcagaagaat acagagtcct acgaggactt catcgccagg 900
ctgctggagg caatcgacgc agagcccgtg acagatccta tcaagaccta cctgaaggtg 960
accctgtctt atacaaacgc cagcaccgac tgccagaagc agatggatag gaccctggga 1020
acacgcgtgc agcaggcaac cgtggaggag aagatgcagg cctgtcggga tgtgggctct 1080
gagggcttta agatgcagct gctggcccag gccctgagac ctcagggcaa ggcaggacag 1140
aagggagtga accagaagtg ctacaattgt ggcaagccag gacacctggc aaggcagtgc 1200
agacagggaa tcatctgcca ccactgtggc aagaggggcc acatgcagaa ggactgtcgc 1260
cagaagaagc agcagggcaa caataggaga ggaccaaggg tggtgccatc tgccccacca 1320
atgctgggtg ccagggaggt gtatccaatc gtgaatggcg gcagcccaaa gaagaagcgg 1380
aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1440
agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1500
acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1560
cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 1620
aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 1680
agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 1740
gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 1800
ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 1860
agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 1920
gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 1980
tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2040
ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2100
atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2160
ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2220
cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2280
gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2340
agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2400
agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2460
gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2520
gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 2580
taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 2640
gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 2700
aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 2760
ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 2820
tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 2880
attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 2940
ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3000
aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3060
tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3120
gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3180
atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3240
atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3300
ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3360
ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3420
ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3480
agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3540
ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 3600
aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 3660
aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 3720
accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 3780
ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 3840
accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 3900
accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 3960
aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4020
gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4080
aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4140
gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4200
agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4260
tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4320
gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4380
tacgcttga 4389
<210> 992
<211> 4809
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP143 plasmid sequence
<400> 992
atgggcaata gctcctctac cccccctcca agcgccctga agaactccga tctgttcaag 60
accatgctga ggacacagta cagcggctcc gtgaagacac ggagaatcaa ccaggatatc 120
aagaagcagt atccactgtg gccagaccag ggaacctgcg caacaaagca ctgggagcag 180
gccgtgctga tccccctgga ctctgtgagc gaggagaccg ccaaggtgct gaatttcctg 240
cgggtgaaga tccaggccag aaagggagag accgcaaggc agatgaccgc acacacaatc 300
aagaagctga tcgtgggcac aatcgataag aacaagcagc agaccgagat cctgcagaag 360
acagacgaga gcgatgagga gatggacacc acaaatacca tgctgtttat cgcccgcaac 420
aagagggaga ggatcgcaca gcagcagcag gcagatctgg cagcacagca gcaggtgctg 480
ctgctgcaga gggagcagca gagggagcag agagagaagg atatcaagaa gcgggacgag 540
aagaagaaga agctgctgcc cgacaccaca cagaaggtgg agcagaccga tatcggagag 600
gccagctcct ctgacgcctc cgcccagaag ccaatctcta ccgacaacaa tcccgatctg 660
aaggtggacg gcgtgctgac aagaagccag cacaccacag tgccttccaa catcaccatc 720
aagaaggatg gcacatccgt gcagtaccag caccccatca ggaactatcc taccggcgag 780
ggcaatctga cagcccaggt gcggaaccct tttagaccac tggagctgca gcagctgagg 840
aaggactgcc ccgccctgcc tgagggcatc ccacagctgg ccgagtggct gacccagaca 900
atggccatct acaattgtga cgaggccgat gtggagcagc tggccagagt gatcttccca 960
acccctgtga ggcagatcgc aggcgtgatc aacggacacg cagcagcaaa taccgcagcc 1020
aagatccaga actacgtgac agcatgcagg cagcactatc cagccgtgtg cgattggggc 1080
accatccagg cctttacata caagccccct cagaccgccc acgagtatgt gaagcacgcc 1140
gagatcatct tcaagaacaa tagcggactg gagtggcagc acgcaaccgt gccttttatc 1200
aatatggtgg tgcagggcct gccacccaag gtgacacggt ccctgatgtc tggcaaccca 1260
gattggagca ccaagacaat cccacagatc atccccctga tgcagcacta cctgaatctg 1320
cagtccagac aggacgccaa gatcaagcag acccctctgg tgctgcagct ggccatgcca 1380
gcccagacaa tgaacggcaa taagggctac gtgggctcct atcctaccaa cgagccatac 1440
tattctttcc agcagcagca gaggccagca cccagagccc ctccaggcaa cgtgccttcc 1500
aatacctgct tcttttgtaa gcagccagga cactggaagg cagactgccc taataagaca 1560
aggaacctgc gcaatatggg caacatggga aggggaggaa gaatgggagg accaccttac 1620
cggagccagc cttatccagc ctttatccag ccaccccaga atcaccagaa ccagtataat 1680
ggcaggatgg atcgctctca gctgcaggcc agcgcccagg agtggctgcc aggaacctac 1740
cctgcaggtg ccgcaaggca gatgaccgca cacacaggcg gcagcccaaa gaagaagcgg 1800
aaggtctcta gacaagagat caagagaatc aacaagatca gaaggagact ggtcaaggac 1860
agcaacacaa agaaggccgg caagacaggc cccatgaaaa ccctgctcgt cagagtgatg 1920
acccctgacc tgagagagcg gctggaaaac ctgagaaaga agcccgagaa catccctcag 1980
cctatcagca acaccagcag ggccaacctg aacaagctgc tgaccgacta caccgagatg 2040
aagaaagcca tcctgcacgt gtactgggaa gagttccaga aagaccccgt gggcctgatg 2100
agcagagttg ctcagcctgc cagcaagaag atcgaccaga acaagctgaa gcccgagatg 2160
gacgagaagg gcaatctgac cacagccggc tttgcctgct ctcagtgtgg ccagcctctg 2220
ttcgtgtaca agctggaaca ggtgtccgag aaaggcaagg cctacaccaa ctacttcggc 2280
agatgtaacg tggccgagca cgagaagctg attctgctgg cccagctgaa acctgagaag 2340
gactctgatg aggccgtgac ctacagcctg ggcaagtttg gacagagagc cctggacttc 2400
tacagcatcc acgtgaccaa agaaagcaca caccccgtga agcccctggc tcagatcgcc 2460
ggcaatagat acgcctctgg acctgtgggc aaagccctgt ccgatgcctg catgggaaca 2520
atcgccagct tcctgagcaa gtaccaggac atcatcatcg agcaccagaa ggtggtcaag 2580
ggcaaccaga agagactgga aagcctgagg gagctggccg gcaaagagaa cctggaatac 2640
cccagcgtga ccctgcctcc tcagcctcac acaaaagaag gcgtggacgc ctacaacgaa 2700
gtgatcgcca gagtgagaat gtgggtcaac ctgaacctgt ggcagaagct gaaactgtcc 2760
agggacgacg ccaagcctct gctgagactg aagggcttcc ctagcttccc tctggtggaa 2820
agacaggcca atgaagtgga ttggtgggac atggtctgca acgtgaagaa gctgatcaac 2880
gagaagaaag aggatggcaa ggttttctgg cagaacctgg ccggctacaa gagacaagaa 2940
gccctgaggc cttacctgag cagcgaagag gaccggaaga agggcaagaa gttcgccaga 3000
taccagctgg gcgacctgct gctgcacctg gaaaagaagc acggcgagga ctggggcaaa 3060
gtgtacgatg aggcctggga gagaatcgac aagaaggtgg aaggcctgag caagcacatt 3120
aagctggaag aggaaagaag gagcgaggac gcccaatcta aagccgctct gaccgattgg 3180
ctgagagcca aggccagctt tgtgatcgag ggcctgaaag aggccgacaa ggacgagttc 3240
tgcagatgcg agctgaagct gcagaagtgg tacggcgatc tgagaggcaa gcccttcgcc 3300
attgaggccg agaacagcat cctggacatc agcggcttca gcaagcagta caactgcgcc 3360
ttcatttggc agaaagacgg cgtcaagaaa ctgaacctgt acctgatcat caattacttc 3420
aaaggcggca agctgcggtt caagaagatc aaacccgagg ccttcgaggc taacagattc 3480
tacaccgtga tcaacaaaaa gtccggcgag atcgtgccca tggaagtgaa cttcaacttc 3540
gacgacccca acctgattat cctgcctctg gccttcggca agagacaggg cagagagttc 3600
atctggaacg atctgctgag cctggaaacc ggctctctga agctggccaa tggcagagtg 3660
atcgagaaaa ccctgtacaa caggagaacc agacaggacg agcctgctct gtttgtggcc 3720
ctgaccttcg agagaagaga ggtgctggac agcagcaaca tcaagcccat gaacctgatc 3780
ggcgtggacc ggggcgagaa tatccctgct gtgatcgccc tgacagaccc tgaaggatgc 3840
ccactgagca gattcaagga ctccctgggc aaccctacac acatcctgag aatcggcgag 3900
agctacaaag agaagcagag gacaatccag gccaagaaag aggtggaaca gagaagagcc 3960
ggcggatact ctaggaagta cgccagcaag gccaagaatc tggccgacga catggtccga 4020
aacaccgcca gagatctgct gtactacgcc gtgacacagg acgccatgct gatcttcgag 4080
aatctgagca gaggcttcgg ccggcagggc aagagaacct ttatggccga gaggcagtac 4140
accagaatgg aagattggct cacagctaaa ctggcctacg agggactgag caagacctac 4200
ctgtccaaaa cactggccca gtatacctcc aagacctgca gcaattgcgg cttcaccatc 4260
accagcgccg actacgacag agtgctggaa aagctcaaga aaaccgccac cggctggatg 4320
accaccatca acggcaaaga gctgaaggtt gagggccaga tcacctacta caacaggtac 4380
aagaggcaga acgtcgtgaa ggatctgagc gtggaactgg acagactgag cgaagagagc 4440
gtgaacaacg acatcagcag ctggacaaag ggcagatcag gcgaggctct gagcctgctg 4500
aagaagaggt ttagccacag acctgtgcaa gagaagttcg tgtgcctgaa ctgcggcttc 4560
gagacacacg ccgatgaaca ggctgccctg aacattgcca gaagctggct gttcctgaga 4620
agccaagagt acaagaagta ccagaccaac aagaccaccg gcaacaccga caagagggcc 4680
tttgtggaaa cctggcagag cttctacaga aaaaagctga aagaagtctg gaagcccgcc 4740
gtgactagtc caaaaaagaa gagaaaggta gccctcgagt acccatatga tgtccctgac 4800
tacgcttga 4809
<210> 993
<211> 4698
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP78 plasmid sequence
<400> 993
atggccctga atgatttcga ccctatcgcc ctccagggct acctgccggc ccctagagtg 60
ctgcaacaca acgacatcat catctgcaga gctacttctg gcccctgggg catcggcgac 120
agatacaacc tgatcaggat ccacctgcaa gaccctgccg gacagcccct tccaatcccc 180
cagtgggagc ctatccctaa ccggaccgcc aacccccgga cacagcccta ccctgtggtg 240
tctgccccaa tggctaccct ggaaaacatc ctgaacaact ttcacatccc ccacggcgtg 300
tccagatacg gccccctgga aggcggagat taccagcctg gcgaacagta cagccaaggc 360
ttctgccctg tgacccaggc cgagattgcc ctgctgaacg gccagcacct ggaagaagag 420
atcacaatcc tgagagagat cacccacaga ctgatgcagg gcgtgcggcc tcctgccgtg 480
cctcagggcc ctgctcctcc tcctcctcca gctcagcctc ctgctcccct gcctgctcca 540
ccaattgggc ctccacctcc cgctgcccct gcccccgccc caggccccat gcctgtgccc 600
cagcatctgc ctattacaca tatcagagcc gtgatcggcg aaacccccgc caacatccgc 660
gaggtgccac tgtggctggc tagagccgtt cccgccctgc agggagtgta ccccgtccag 720
gacgccgtga tgagaagccg caccgtgaac gccctgaccg tgcggcaccc tggactggcc 780
ctggaacctc tggagtgcgg cagctggcaa gagtgtctgg ccgccctgtg gcagagaacc 840
ttcggcgcca ccgccctgca cgccctgggc gataccctgg gtcagatcgc aaacagcgac 900
ggcatcgtga tggctatcga gctgggcctg ctcttttccg atgataactg ggacctggtg 960
tggggaatct gtagaagatt cctgcccggc caggccgtct gcgtggccgt gcaggccaga 1020
ctggatcccc tgcccgacaa cgctacaaga atcgtgatga tcagccacat catccgggac 1080
gtgtacgcca tcctgggcct ggaccctctg ggcagaccca tgcagcagac actgcctaga 1140
cggaacaacc agcctcccag acagcagcca cagagacggc agcagcctag aagaaccggc 1200
aaccaggagg aaagaggcca gcggaaccgg ggccggcaga acgcccagac ccctcggcag 1260
gagggcaaca gactgcagaa cagccagctg cctggccctc gcgactgccc caacaatagc 1320
aaccagcctc ggtaccctct gcggccaaac ccccagcagc cccaaagata cggccaggag 1380
cagaatcgtg gcaacaatcc caacccttac agacaaccta cccctggcaa tggaaatcaa 1440
aacagaaact tcagccgggg gcctgcccca gtcaatgagc agagcagagg cagaggaaga 1500
tctagccagg gtacaaataa caccggctcc tctgctgtgc acagcgtgcg gctgaccagc 1560
gccgcccctc ctataccccc acaagatgcc ggcactccgc ccacttcaag tggaaatcaa 1620
gggcaatcat cttaaggtgc ctctgctgtg cacagcgtgc ggctgggcgg cagcccaaag 1680
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1740
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1800
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1860
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1920
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1980
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2040
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2100
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2160
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2220
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2280
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2340
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2400
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2460
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2520
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2580
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2640
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2700
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2760
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2820
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2880
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2940
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3000
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3060
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3120
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3180
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3240
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3300
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3360
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3420
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3480
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3540
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3600
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3660
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3720
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3780
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3840
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3900
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3960
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4020
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4080
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4140
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4200
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4260
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4320
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4380
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4440
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4500
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4560
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4620
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4680
gtccctgact acgcttga 4698
<210> 994
<211> 4995
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP79 plasmid sequence
<400> 994
atgagccagc cctccgcttc tggcagcgcc ggcgccggag gcgcccctca gcaacctcct 60
cctccacctc cccagcccgg acctgccgcc cccgtgccta gagcccagat cggttatgga 120
gatctggacg tgcttctgct gcaacaggag taccacctca tcgatcctaa tctgcaagtg 180
caacacctgg acaccctgct ggtgagaatc acaggcggaa actggggccc tggcgataga 240
ttcgccagaa tcgaggtgct gctccgcgac acactgggcc ctctgcaaca gcctagatac 300
agatacgccg ccatgcagca ggccgacctg agaaacgaca tcatcctgca cctgaactac 360
caggatgcca tcatcatctt cgacatgatc atccccagcg agggcgtgca ccggcacggc 420
cctatgtttg acggcctgtg gatccacggc gacgactaca gcatgaactt ccagcctatc 480
acagcccacg agctgtacct gctgcctcag caggtgctga ccgaggaagt ggaactgctc 540
accgaggtgt gcaacagaat ggccgattgg atccggcggc acaggtgtgg cggaggaagc 600
ggctcctctc agccacctcc tcccccacct ccagccgtgc cagtgctgcc tagtgcccct 660
ccagccagca gcctgcccct gcccccacag ggctggggca tctctcctcc cgtggctacc 720
agcacccctg gcgctgccgg acattctagc agcgccggtc ctaacatcag cctgggcggc 780
acctacgtgc cccctcctgt ggctcctcca gcccctgtga tcggcggccc tggcggaccc 840
ggacagctgc ctgctatggt gcaggtgctg cccgctcaac ctgtcgtgat ccccattaac 900
gtgatcagat ctgtgtgcgg cgatacacct agcaaccctc aagacatccc tctgtggatg 960
ggcagaatca tccccgccat tgagggcgtc tttcctattg acaaccccaa tctgagaatg 1020
agagtggtga acgccctgct ggctctgcat cctggcctgg ctatcaccga actgaatgcc 1080
cagacatggg gccaggttct ggctgtgctg cacatgcggg ccctgggaca caccgccctg 1140
caccagctgc ctgccctgct ggaaacaatc gtgaagaccg acggcatcct gccagcttat 1200
aacatgggca tggaagttac acagcaggat ttcagctacg tgtggggcat cctgcggaca 1260
ctgttgcccg gccaagcctt cgtgctgagc atgcagaacg agctggaccg gctgcctgcc 1320
gcccagagac ctggaatgtt ccccggcctg ctgcagagaa ccctggatat cctgggcctg 1380
aacagcagag gacagaacat ccagaaaacc aacacccagc agcaggcccc aaagcggggc 1440
cagaagccta agcccagact gcccccagtg cacagacggc ctgcaccctt cacccctcct 1500
gccaccccca gccctcggca gcaggccagc gccagcccca gcagccaggg cgacaacaga 1560
agccctcagc ctcagggcag aggcacatac ggcccgagcc ggggaggcgg ctctggccct 1620
agatacaact tccgtcccag agtgcagcct cccgacagat acggcttcgg cagaggccag 1680
ggaggcagaa gcagcatcgg cgcccaggac aatcagcagc ccggacaagg cggacagcgg 1740
acccagcaga ccaaccagaa ccgcaaccag ggcaacgcca ccggcggtag aacccagcct 1800
cagaatagaa cagtgaacac cgtgcgggtg acccagacca atcctcaagg cggctcctcc 1860
gtgtccaacc cagctgtgac aacttctcag aatacaggaa caggaagtgc aactcagagc 1920
tcatcatctt aaggtgccag aacagtgaac accgtgcggg tgggcggcag cccaaagaag 1980
aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 2040
aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 2100
gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 2160
cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 2220
gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 2280
ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 2340
gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 2400
cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 2460
ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 2520
gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 2580
gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 2640
atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 2700
ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 2760
gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 2820
gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 2880
aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2940
ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 3000
gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 3060
atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 3120
caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 3180
gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 3240
ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 3300
cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 3360
gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 3420
gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 3480
ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 3540
tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 3600
tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 3660
agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 3720
aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 3780
gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 3840
agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3900
gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3960
ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 4020
ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 4080
ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 4140
agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 4200
gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 4260
ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 4320
cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 4380
acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 4440
accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 4500
tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 4560
aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 4620
gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 4680
ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 4740
ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 4800
ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 4860
agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4920
cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4980
cctgactacg cttga 4995
<210> 995
<211> 5010
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP80 plasmid sequence
<400> 995
atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60
ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120
accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180
gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240
cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300
gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360
gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420
gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480
ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540
atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600
agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660
cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720
tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780
gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840
gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900
gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960
ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020
gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080
ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140
cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200
caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260
ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320
cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380
aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440
acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500
cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560
ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620
ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680
accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740
gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800
ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860
aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920
gcttccagcg gagatcaaag gaactaaggt gccagagccg tcaacacagt gacccagggc 1980
ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 2040
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 2100
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 2160
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 2220
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 2280
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 2340
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 2400
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 2460
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 2520
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 2580
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2640
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2700
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2760
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2820
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2880
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2940
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 3000
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 3060
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 3120
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 3180
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 3240
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 3300
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 3360
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 3420
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 3480
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 3540
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3600
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3660
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3720
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3780
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3840
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3900
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3960
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 4020
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 4080
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 4140
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 4200
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 4260
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 4320
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 4380
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 4440
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 4500
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 4560
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4620
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4680
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4740
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4800
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4860
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4920
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4980
tacccatatg atgtccctga ctacgcttga 5010
<210> 996
<211> 4663
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP81 plasmid sequence
<400> 996
atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60
atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120
gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180
cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240
tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300
cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360
cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420
gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480
atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540
cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600
cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660
cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720
tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780
gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840
tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900
ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960
ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020
cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080
gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140
ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200
gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260
agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320
cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380
agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440
tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500
caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560
agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620
ctacaacaaa ggcggcagcc caaagaagaa gcggaaggtc tctagacaag agatcaagag 1680
aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac 1740
aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga 1800
aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa 1860
cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg 1920
ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa 1980
gaagatcgac cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc 2040
cggctttgcc tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc 2100
cgagaaaggc aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa 2160
gctgattctg ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag 2220
cctgggcaag tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag 2280
cacacacccc gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt 2340
gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca 2400
ggacatcatc atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct 2460
gagggagctg gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc 2520
tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt 2580
caacctgaac ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag 2640
actgaagggc ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg 2700
ggacatggtc tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt 2760
ctggcagaac ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga 2820
agaggaccgg aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca 2880
cctggaaaag aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat 2940
cgacaagaag gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga 3000
ggacgcccaa tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat 3060
cgagggcctg aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa 3120
gtggtacggc gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga 3180
catcagcggc ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa 3240
gaaactgaac ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa 3300
gatcaaaccc gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg 3360
cgagatcgtg cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc 3420
tctggccttc ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga 3480
aaccggctct ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag 3540
aaccagacag gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct 3600
ggacagcagc aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc 3660
tgctgtgatc gccctgacag accctgaagg atgcccactg agcagattca aggactccct 3720
gggcaaccct acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat 3780
ccaggccaag aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag 3840
caaggccaag aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta 3900
cgccgtgaca caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca 3960
gggcaagaga acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc 4020
taaactggcc tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac 4080
ctccaagacc tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct 4140
ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa 4200
ggttgagggc cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct 4260
gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac 4320
aaagggcaga tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt 4380
gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc 4440
cctgaacatt gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac 4500
caacaagacc accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta 4560
cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa 4620
ggtagccctc gagtacccat atgatgtccc tgactacgct tga 4663
<210> 997
<211> 4528
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP82 plasmid sequence
<400> 997
atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60
cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120
ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180
gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240
ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300
cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360
cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420
gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480
atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540
ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600
agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660
gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720
agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780
gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840
ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900
ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960
attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020
aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080
cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140
aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200
gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260
aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320
ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380
ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440
ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaggcgg 1500
cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag 1560
aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac 1620
cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa 1680
gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct 1740
gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa 1800
agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa 1860
caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc 1920
tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc 1980
ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc 2040
ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg 2100
acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa 2160
gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc 2220
cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga 2280
gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg 2340
caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg 2400
cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg 2460
gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc 2520
tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa 2580
cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc 2640
cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa 2700
gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca 2760
cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga 2820
aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa 2880
agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga 2940
ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct 3000
gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag 3060
caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta 3120
cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc 3180
cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat 3240
ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa 3300
gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa 3360
gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga 3420
gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat 3480
caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct 3540
gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca 3600
catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga 3660
ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct 3720
ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga 3780
cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt 3840
tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga 3900
gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag 3960
caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa 4020
aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat 4080
cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga 4140
cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg 4200
cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt 4260
gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag 4320
aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg 4380
caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa 4440
agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta 4500
cccatatgat gtccctgact acgcttga 4528
<210> 998
<211> 4977
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP83 plasmid sequence
<400> 998
atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60
ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120
tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180
cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240
accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300
gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360
ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420
aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480
gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540
gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600
ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660
tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720
aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780
cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840
cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900
agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960
aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020
atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080
tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140
ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200
ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260
cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320
gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380
gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440
gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500
ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560
agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620
agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680
cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740
agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800
aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860
gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977
<210> 999
<211> 4977
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP84 plasmid sequence
<400> 999
atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60
ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120
tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180
cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240
accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300
ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360
ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420
gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480
gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540
gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600
ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660
tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720
aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780
cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840
cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900
agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960
aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020
atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080
tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140
ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200
ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260
cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320
gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380
gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440
ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500
caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560
ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620
cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680
cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740
cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800
aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860
accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977
<210> 1000
<211> 4805
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP88 plasmid sequence
<400> 1000
atgggtgcga gagcgtcagt attaagcggg ggagaattag atcgatggga aaaaattcgg 60
ttaaggccag ggggaaagaa aaaatataaa ttaaaacata tagtatgggc aagcagggag 120
ctagaacgat tcgcagttaa tcctggcctg ttagaaacat cagaaggctg tagacaaata 180
ctgggacagc tacaaccatc ccttcagaca ggatcagaag aacttagatc attatataat 240
acagtagcaa ccctctattg tgtgcatcaa aggatagaga taaaagacac caaggaagct 300
ttagacaaga tagaggaaga gcaaaacaaa agtaagaaaa aagcacagca agcagcagct 360
gacacaggac acagcaatca ggtcagccaa aattacccta tagtgcagaa catccagggg 420
caaatggtac atcaggccat atcacctaga actttaaatg catgggtaaa agtagtagaa 480
gagaaggctt tcagcccaga agtgataccc atgttttcag cattatcaga aggagccacc 540
ccacaagatt taaacaccat gctaaacaca gtggggggac atcaagcagc catgcaaatg 600
ttaaaagaga ccatcaatga ggaagctgca gaatgggata gagtgcatcc agtgcatgca 660
gggcctattg caccaggcca gatgagagaa ccaaggggaa gtgacatagc aggaactact 720
agtacccttc aggaacaaat aggatggatg acacataatc cacctatccc agtaggagaa 780
atctataaaa gatggataat cctgggatta aataaaatag taagaatgta tagccctacc 840
agcattctgg acataagaca aggaccaaag gaacccttta gagactatgt agaccgattc 900
tataaaactc taagagccga gcaagcttca caagaggtaa aaaattggat gacagaaacc 960
ttgttggtcc aaaatgcgaa cccagattgt aagactattt taaaagcatt gggaccagga 1020
gcgacactag aagaaatgat gacagcatgt cagggagtgg ggggacccgg ccataaagca 1080
agagttttgg ctgaagcaat gagccaagta acaaatccag ctaccataat gatacagaaa 1140
ggcaatttta ggaaccaaag aaagactgtt aagtgtttca attgtggcaa agaagggcac 1200
atagccaaaa attgcagggc ccctaggaaa aagggctgtt ggaaatgtgg aaaggaagga 1260
caccaaatga aagattgtac tgagagacag gctaattttt tagggaagat ctggccttcc 1320
cacaagggaa ggccagggaa ttttcttcag agcagaccag agccaacagc cccaccagaa 1380
gagagcttca ggtttgggga agagacaaca actccctctc agaagcagga gccgatagac 1440
aaggaactgt atcctttagc ttccctcaga tcactctttg gcagcgaccc ctcgtcacaa 1500
taaagatagg ggggcaatta aaggaagctc tattagatac aggagcagat gatacagtat 1560
tagaagaaat gaatttgcca ggaagatgga aaccaaaaat gataggggga attggaggtt 1620
ttatcaaagt aagacagtat gatcagatac tcatagaaat ctgcggacat aaagctatag 1680
gtacagtatt agtaggacct acacctgtca acataattgg aagaaatctg ttgactcaga 1740
ttggctgcac tttaaatttt cccattagtc ctattgagac tgtaccaaag aagaagcgga 1800
aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg gtcaaggaca 1860
gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc agagtgatga 1920
cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac atccctcagc 1980
ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac accgagatga 2040
agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg ggcctgatga 2100
gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag cccgagatgg 2160
acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc cagcctctgt 2220
tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac tacttcggca 2280
gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa cctgagaagg 2340
actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc ctggacttct 2400
acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct cagatcgccg 2460
gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc atgggaacaa 2520
tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag gtggtcaagg 2580
gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac ctggaatacc 2640
ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc tacaacgaag 2700
tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg aaactgtcca 2760
gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct ctggtggaaa 2820
gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag ctgatcaacg 2880
agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag agacaagaag 2940
ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag ttcgccagat 3000
accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac tggggcaaag 3060
tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc aagcacatta 3120
agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg accgattggc 3180
tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag gacgagttct 3240
gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag cccttcgcca 3300
ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac aactgcgcct 3360
tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc aattacttca 3420
aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct aacagattct 3480
acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac ttcaacttcg 3540
acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc agagagttca 3600
tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat ggcagagtga 3660
tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg tttgtggccc 3720
tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg aacctgatcg 3780
gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct gaaggatgcc 3840
cactgagcag attcaaggac tccctgggca accctacaca catcctgaga atcggcgaga 3900
gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag agaagagccg 3960
gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac atggtccgaa 4020
acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg atcttcgaga 4080
atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag aggcagtaca 4140
ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc aagacctacc 4200
tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc ttcaccatca 4260
ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc ggctggatga 4320
ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac aacaggtaca 4380
agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc gaagagagcg 4440
tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg agcctgctga 4500
agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac tgcggcttcg 4560
agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg ttcctgagaa 4620
gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac aagagggcct 4680
ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg aagcccgccg 4740
tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat gtccctgact 4800
acgct 4805
<210> 1001
<211> 2413
<212> DNA
<213> Artificial Sequence
<220>
<223> pStx42.174.12.7 plasmid sequence
<400> 1001
gctagctagg tctagacgtc aggtggcact tttcggggaa atgtgcgcgg aacccctatt 60
tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata accctgataa 120
atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg tgtcgccctt 180
attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac gctggtgaaa 240
gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact ggatctcaac 300
agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat gagcactttt 360
aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga gcaactcggt 420
cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac agaaaagcat 480
cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat gagtgataac 540
actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac cgcttttttg 600
cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct gaatgaagcc 660
ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa 720
ctattaactg gcgaactact tactctagct tcccggcaac aattaataga ctggatggag 780
gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg gtttattgct 840
gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact ggggccagat 900
ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac tatggatgaa 960
cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta actgtcagac 1020
caagtttact catatatact ttagattgat ttaaaacttc atttttaatt taaaaggatc 1080
taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga gttttcgttc 1140
cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc tttttttctg 1200
cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg 1260
gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc gcagatacca 1320
aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc tgtagcaccg 1380
cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg cgataagtcg 1440
tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg gtcgggctga 1500
acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga actgagatac 1560
ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc ggacaggtat 1620
ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg gggaaacgcc 1680
tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg atttttgtga 1740
tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt tttacggttc 1800
ccgacaggcc cgaaggaata gaagaagaag gtggagagag agacagagac agatccattc 1860
gattagtgaa cggatctcga cggtatcgcc tttaaaagaa aaggggggat tggggggtac 1920
agtgcagggg aaagaatagt agacataata gcaacagaca tacaaactaa agaactacaa 1980
aaacaaatta caaaaattca aaattttcgg gtttattaca gggacagcag agatccagtt 2040
tgagggccta tttcccatga ttccttcata tttgcatata cgatacaagg ctgttagaga 2100
gataattgga attaatttga ctgtaaacac aaagatatta gtacaaaata cgtgacgtag 2160
aaagtaataa tttcttgggt agtttgcagt tttaaaatta tgttttaaaa tggactatca 2220
tatgcttacc gtaacttgaa agtatttcga tttcttggct ttatatatct tgtggaaagg 2280
acgaaacacc actggcgctt ttatctgatt actttgagag ccatcaccag cgactatgtc 2340
gtagtgggta aagctccctc ttcggaggga gcatcaaagc tgcattctag ttgtggtttt 2400
tttttttgaa ttc 2413
<210> 1002
<211> 1536
<212> DNA
<213> Artificial Sequence
<220>
<223> pGP2 plasmid sequence
<400> 1002
atgaagtgcc ttttgtactt agccttttta ttcattgggg tgaattgcaa gttcaccata 60
gtttttccac acaaccaaaa aggaaactgg aaaaatgttc cttctaatta ccattattgc 120
ccgtcaagct cagatttaaa ttggcataat gacttaatag gcacagcctt acaagtcaaa 180
atgcccaaga gtcacaaggc tattcaagca gacggttgga tgtgtcatgc ttccaaatgg 240
gtcactactt gtgatttccg ctggtatgga ccgaagtata taacacattc catccgatcc 300
ttcactccat ctgtagaaca atgcaaggaa agcattgaac aaacgaaaca aggaacttgg 360
ctgaatccag gcttccctcc tcaaagttgt ggatatgcaa ctgtgacgga tgccgaagca 420
gtgattgtcc aggtgactcc tcaccatgtg ctggttgatg aatacacagg agaatgggtt 480
gattcacagt tcatcaacgg aaaatgcagc aattacatat gccccactgt ccataactct 540
acaacctggc attctgacta taaggtcaaa gggctatgtg attctaacct catttccatg 600
gacatcacct tcttctcaga ggacggagag ctatcatccc tgggaaagga gggcacaggg 660
ttcagaagta actactttgc ttatgaaact ggaggcaagg cctgcaaaat gcaatactgc 720
aagcattggg gagtcagact cccatcaggt gtctggttcg agatggctga taaggatctc 780
tttgctgcag ccagattccc tgaatgccca gaagggtcaa gtatctctgc tccatctcag 840
acctcagtgg atgtaagtct aattcaggac gttgagagga tcttggatta ttccctctgc 900
caagaaacct ggagcaaaat cagagcgggt cttccaatct ctccagtgga tctcagctat 960
cttgctccta aaaacccagg aaccggtcct gctttcacca taatcaatgg taccctaaaa 1020
tactttgaga ccagatacat cagagtcgat attgctgctc caatcctctc aagaatggtc 1080
ggaatgatca gtggaactac cacagaaagg gaactgtggg atgactgggc accatatgaa 1140
gacgtggaaa ttggacccaa tggagttctg aggaccagtt caggatataa gtttccttta 1200
tacatgattg gacatggtat gttggactcc gatcttcatc ttagctcaaa ggctcaggtg 1260
ttcgaacatc ctcacattca agacgctgct tcgcaacttc ctgatgatga gagtttattt 1320
tttggtgata ctgggctatc caaaaatcca atcgagcttg tagaaggttg gttcagtagt 1380
tggaaaagct ctattgcctc ttttttcttt atcatagggt taatcattgg actattcttg 1440
gttctccgag ttggtatcca tctttgcatt aaattaaagc acaccaagaa aagacagatt 1500
tatacagaca tagagatgaa ccgacttgga aagtaa 1536
<210> 1003
<211> 4698
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP78 plasmid sequence
<400> 1003
atggccctga atgatttcga ccctatcgcc ctccagggct acctgccggc ccctagagtg 60
ctgcaacaca acgacatcat catctgcaga gctacttctg gcccctgggg catcggcgac 120
agatacaacc tgatcaggat ccacctgcaa gaccctgccg gacagcccct tccaatcccc 180
cagtgggagc ctatccctaa ccggaccgcc aacccccgga cacagcccta ccctgtggtg 240
tctgccccaa tggctaccct ggaaaacatc ctgaacaact ttcacatccc ccacggcgtg 300
tccagatacg gccccctgga aggcggagat taccagcctg gcgaacagta cagccaaggc 360
ttctgccctg tgacccaggc cgagattgcc ctgctgaacg gccagcacct ggaagaagag 420
atcacaatcc tgagagagat cacccacaga ctgatgcagg gcgtgcggcc tcctgccgtg 480
cctcagggcc ctgctcctcc tcctcctcca gctcagcctc ctgctcccct gcctgctcca 540
ccaattgggc ctccacctcc cgctgcccct gcccccgccc caggccccat gcctgtgccc 600
cagcatctgc ctattacaca tatcagagcc gtgatcggcg aaacccccgc caacatccgc 660
gaggtgccac tgtggctggc tagagccgtt cccgccctgc agggagtgta ccccgtccag 720
gacgccgtga tgagaagccg caccgtgaac gccctgaccg tgcggcaccc tggactggcc 780
ctggaacctc tggagtgcgg cagctggcaa gagtgtctgg ccgccctgtg gcagagaacc 840
ttcggcgcca ccgccctgca cgccctgggc gataccctgg gtcagatcgc aaacagcgac 900
ggcatcgtga tggctatcga gctgggcctg ctcttttccg atgataactg ggacctggtg 960
tggggaatct gtagaagatt cctgcccggc caggccgtct gcgtggccgt gcaggccaga 1020
ctggatcccc tgcccgacaa cgctacaaga atcgtgatga tcagccacat catccgggac 1080
gtgtacgcca tcctgggcct ggaccctctg ggcagaccca tgcagcagac actgcctaga 1140
cggaacaacc agcctcccag acagcagcca cagagacggc agcagcctag aagaaccggc 1200
aaccaggagg aaagaggcca gcggaaccgg ggccggcaga acgcccagac ccctcggcag 1260
gagggcaaca gactgcagaa cagccagctg cctggccctc gcgactgccc caacaatagc 1320
aaccagcctc ggtaccctct gcggccaaac ccccagcagc cccaaagata cggccaggag 1380
cagaatcgtg gcaacaatcc caacccttac agacaaccta cccctggcaa tggaaatcaa 1440
aacagaaact tcagccgggg gcctgcccca gtcaatgagc agagcagagg cagaggaaga 1500
tctagccagg gtacaaataa caccggctcc tctgctgtgc acagcgtgcg gctgaccagc 1560
gccgcccctc ctataccccc acaagatgcc ggcactccgc ccacttcaag tggaaatcaa 1620
gggcaatcat cttaaggtgc ctctgctgtg cacagcgtgc ggctgggcgg cagcccaaag 1680
aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag aaggagactg 1740
gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac cctgctcgtc 1800
agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa gcccgagaac 1860
atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct gaccgactac 1920
accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa agaccccgtg 1980
ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa caagctgaag 2040
cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc tcagtgtggc 2100
cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc ctacaccaac 2160
tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc ccagctgaaa 2220
cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg acagagagcc 2280
ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa gcccctggct 2340
cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc cgatgcctgc 2400
atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga gcaccagaag 2460
gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg caaagagaac 2520
ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg cgtggacgcc 2580
tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg gcagaagctg 2640
aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc tagcttccct 2700
ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa cgtgaagaag 2760
ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc cggctacaag 2820
agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa gggcaagaag 2880
ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca cggcgaggac 2940
tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga aggcctgagc 3000
aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa agccgctctg 3060
accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga ggccgacaag 3120
gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct gagaggcaag 3180
cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag caagcagtac 3240
aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta cctgatcatc 3300
aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc cttcgaggct 3360
aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat ggaagtgaac 3420
ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa gagacagggc 3480
agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa gctggccaat 3540
ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga gcctgctctg 3600
tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat caagcccatg 3660
aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct gacagaccct 3720
gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca catcctgaga 3780
atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga ggtggaacag 3840
agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct ggccgacgac 3900
atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga cgccatgctg 3960
atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt tatggccgag 4020
aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga gggactgagc 4080
aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag caattgcggc 4140
ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa aaccgccacc 4200
ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat cacctactac 4260
aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga cagactgagc 4320
gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg cgaggctctg 4380
agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt gtgcctgaac 4440
tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag aagctggctg 4500
ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg caacaccgac 4560
aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa agaagtctgg 4620
aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta cccatatgat 4680
gtccctgact acgcttga 4698
<210> 1004
<211> 4995
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP79 plasmid sequence
<400> 1004
atgagccagc cctccgcttc tggcagcgcc ggcgccggag gcgcccctca gcaacctcct 60
cctccacctc cccagcccgg acctgccgcc cccgtgccta gagcccagat cggttatgga 120
gatctggacg tgcttctgct gcaacaggag taccacctca tcgatcctaa tctgcaagtg 180
caacacctgg acaccctgct ggtgagaatc acaggcggaa actggggccc tggcgataga 240
ttcgccagaa tcgaggtgct gctccgcgac acactgggcc ctctgcaaca gcctagatac 300
agatacgccg ccatgcagca ggccgacctg agaaacgaca tcatcctgca cctgaactac 360
caggatgcca tcatcatctt cgacatgatc atccccagcg agggcgtgca ccggcacggc 420
cctatgtttg acggcctgtg gatccacggc gacgactaca gcatgaactt ccagcctatc 480
acagcccacg agctgtacct gctgcctcag caggtgctga ccgaggaagt ggaactgctc 540
accgaggtgt gcaacagaat ggccgattgg atccggcggc acaggtgtgg cggaggaagc 600
ggctcctctc agccacctcc tcccccacct ccagccgtgc cagtgctgcc tagtgcccct 660
ccagccagca gcctgcccct gcccccacag ggctggggca tctctcctcc cgtggctacc 720
agcacccctg gcgctgccgg acattctagc agcgccggtc ctaacatcag cctgggcggc 780
acctacgtgc cccctcctgt ggctcctcca gcccctgtga tcggcggccc tggcggaccc 840
ggacagctgc ctgctatggt gcaggtgctg cccgctcaac ctgtcgtgat ccccattaac 900
gtgatcagat ctgtgtgcgg cgatacacct agcaaccctc aagacatccc tctgtggatg 960
ggcagaatca tccccgccat tgagggcgtc tttcctattg acaaccccaa tctgagaatg 1020
agagtggtga acgccctgct ggctctgcat cctggcctgg ctatcaccga actgaatgcc 1080
cagacatggg gccaggttct ggctgtgctg cacatgcggg ccctgggaca caccgccctg 1140
caccagctgc ctgccctgct ggaaacaatc gtgaagaccg acggcatcct gccagcttat 1200
aacatgggca tggaagttac acagcaggat ttcagctacg tgtggggcat cctgcggaca 1260
ctgttgcccg gccaagcctt cgtgctgagc atgcagaacg agctggaccg gctgcctgcc 1320
gcccagagac ctggaatgtt ccccggcctg ctgcagagaa ccctggatat cctgggcctg 1380
aacagcagag gacagaacat ccagaaaacc aacacccagc agcaggcccc aaagcggggc 1440
cagaagccta agcccagact gcccccagtg cacagacggc ctgcaccctt cacccctcct 1500
gccaccccca gccctcggca gcaggccagc gccagcccca gcagccaggg cgacaacaga 1560
agccctcagc ctcagggcag aggcacatac ggcccgagcc ggggaggcgg ctctggccct 1620
agatacaact tccgtcccag agtgcagcct cccgacagat acggcttcgg cagaggccag 1680
ggaggcagaa gcagcatcgg cgcccaggac aatcagcagc ccggacaagg cggacagcgg 1740
acccagcaga ccaaccagaa ccgcaaccag ggcaacgcca ccggcggtag aacccagcct 1800
cagaatagaa cagtgaacac cgtgcgggtg acccagacca atcctcaagg cggctcctcc 1860
gtgtccaacc cagctgtgac aacttctcag aatacaggaa caggaagtgc aactcagagc 1920
tcatcatctt aaggtgccag aacagtgaac accgtgcggg tgggcggcag cccaaagaag 1980
aagcggaagg tctctagaca agagatcaag agaatcaaca agatcagaag gagactggtc 2040
aaggacagca acacaaagaa ggccggcaag acaggcccca tgaaaaccct gctcgtcaga 2100
gtgatgaccc ctgacctgag agagcggctg gaaaacctga gaaagaagcc cgagaacatc 2160
cctcagccta tcagcaacac cagcagggcc aacctgaaca agctgctgac cgactacacc 2220
gagatgaaga aagccatcct gcacgtgtac tgggaagagt tccagaaaga ccccgtgggc 2280
ctgatgagca gagttgctca gcctgccagc aagaagatcg accagaacaa gctgaagccc 2340
gagatggacg agaagggcaa tctgaccaca gccggctttg cctgctctca gtgtggccag 2400
cctctgttcg tgtacaagct ggaacaggtg tccgagaaag gcaaggccta caccaactac 2460
ttcggcagat gtaacgtggc cgagcacgag aagctgattc tgctggccca gctgaaacct 2520
gagaaggact ctgatgaggc cgtgacctac agcctgggca agtttggaca gagagccctg 2580
gacttctaca gcatccacgt gaccaaagaa agcacacacc ccgtgaagcc cctggctcag 2640
atcgccggca atagatacgc ctctggacct gtgggcaaag ccctgtccga tgcctgcatg 2700
ggaacaatcg ccagcttcct gagcaagtac caggacatca tcatcgagca ccagaaggtg 2760
gtcaagggca accagaagag actggaaagc ctgagggagc tggccggcaa agagaacctg 2820
gaatacccca gcgtgaccct gcctcctcag cctcacacaa aagaaggcgt ggacgcctac 2880
aacgaagtga tcgccagagt gagaatgtgg gtcaacctga acctgtggca gaagctgaaa 2940
ctgtccaggg acgacgccaa gcctctgctg agactgaagg gcttccctag cttccctctg 3000
gtggaaagac aggccaatga agtggattgg tgggacatgg tctgcaacgt gaagaagctg 3060
atcaacgaga agaaagagga tggcaaggtt ttctggcaga acctggccgg ctacaagaga 3120
caagaagccc tgaggcctta cctgagcagc gaagaggacc ggaagaaggg caagaagttc 3180
gccagatacc agctgggcga cctgctgctg cacctggaaa agaagcacgg cgaggactgg 3240
ggcaaagtgt acgatgaggc ctgggagaga atcgacaaga aggtggaagg cctgagcaag 3300
cacattaagc tggaagagga aagaaggagc gaggacgccc aatctaaagc cgctctgacc 3360
gattggctga gagccaaggc cagctttgtg atcgagggcc tgaaagaggc cgacaaggac 3420
gagttctgca gatgcgagct gaagctgcag aagtggtacg gcgatctgag aggcaagccc 3480
ttcgccattg aggccgagaa cagcatcctg gacatcagcg gcttcagcaa gcagtacaac 3540
tgcgccttca tttggcagaa agacggcgtc aagaaactga acctgtacct gatcatcaat 3600
tacttcaaag gcggcaagct gcggttcaag aagatcaaac ccgaggcctt cgaggctaac 3660
agattctaca ccgtgatcaa caaaaagtcc ggcgagatcg tgcccatgga agtgaacttc 3720
aacttcgacg accccaacct gattatcctg cctctggcct tcggcaagag acagggcaga 3780
gagttcatct ggaacgatct gctgagcctg gaaaccggct ctctgaagct ggccaatggc 3840
agagtgatcg agaaaaccct gtacaacagg agaaccagac aggacgagcc tgctctgttt 3900
gtggccctga ccttcgagag aagagaggtg ctggacagca gcaacatcaa gcccatgaac 3960
ctgatcggcg tggaccgggg cgagaatatc cctgctgtga tcgccctgac agaccctgaa 4020
ggatgcccac tgagcagatt caaggactcc ctgggcaacc ctacacacat cctgagaatc 4080
ggcgagagct acaaagagaa gcagaggaca atccaggcca agaaagaggt ggaacagaga 4140
agagccggcg gatactctag gaagtacgcc agcaaggcca agaatctggc cgacgacatg 4200
gtccgaaaca ccgccagaga tctgctgtac tacgccgtga cacaggacgc catgctgatc 4260
ttcgagaatc tgagcagagg cttcggccgg cagggcaaga gaacctttat ggccgagagg 4320
cagtacacca gaatggaaga ttggctcaca gctaaactgg cctacgaggg actgagcaag 4380
acctacctgt ccaaaacact ggcccagtat acctccaaga cctgcagcaa ttgcggcttc 4440
accatcacca gcgccgacta cgacagagtg ctggaaaagc tcaagaaaac cgccaccggc 4500
tggatgacca ccatcaacgg caaagagctg aaggttgagg gccagatcac ctactacaac 4560
aggtacaaga ggcagaacgt cgtgaaggat ctgagcgtgg aactggacag actgagcgaa 4620
gagagcgtga acaacgacat cagcagctgg acaaagggca gatcaggcga ggctctgagc 4680
ctgctgaaga agaggtttag ccacagacct gtgcaagaga agttcgtgtg cctgaactgc 4740
ggcttcgaga cacacgccga tgaacaggct gccctgaaca ttgccagaag ctggctgttc 4800
ctgagaagcc aagagtacaa gaagtaccag accaacaaga ccaccggcaa caccgacaag 4860
agggcctttg tggaaacctg gcagagcttc tacagaaaaa agctgaaaga agtctggaag 4920
cccgccgtga ctagtccaaa aaagaagaga aaggtagccc tcgagtaccc atatgatgtc 4980
cctgactacg cttga 4995
<210> 1005
<211> 5010
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP80 plasmid sequence
<400> 1005
atggcctctg gcagcaacgt ggaggaatac gagctggatg tggaagccct ggtggtcatc 60
ctgcgggaca gaaacatcgg aagaaatccc ctgcacggcg aaatcatcgg cctgagactg 120
accgagggct ggtggggcca gatcgagaga tttcagatgg tgcggctgat cctgcaggac 180
gacgacaacg agcccctgca gagaccccgc tacgaggtga tccccagagc cgtgaacccc 240
cacaccatgt tcatgatcag cggccccctg gctgaactgc agctggcctt ccaggacctg 300
gacctgcccg agggccctct gcggtttggc ccgctggcta acggccacta cgtgcagggg 360
gatccttaca gcagcagcta ccggcccgtg accatggccg aaacagccca gatgaccaga 420
gatgagctgg aagatatcct gaacacccaa agcgagatcg agatccagat gatcaacctg 480
ctggaacttt atgaggtgga aaccagagcc ctgagaagac agctggccga gagaagcagc 540
atcggccagg gaggagtgag ccccggcgct ccaaggccga gacctccagt tagcagcttc 600
agcggcctgc ctagcctgcc ttctatcccc ggcatccacc ccagagcccc ttcccctcct 660
cgcgctacaa gcacccctgg taacatcccc tggtccctgg gagatgacag cccacctagc 720
tcgtcttttc ctggccctag tcagcctaga gtgtctttcc accctggcaa tcctttcgtg 780
gaggacgagg gacatagacc tagatcccag agccgggaaa gacggagaaa caatcctcct 840
gcccctatcc ctagcgcccc tccaatgatc caatacgtgc ccgtgcctcc tccacctcct 900
gtcggaaccg tgatacctat ccaacacatc cggtccgtga ccggcgagcc tccaaagaac 960
ccccgagaaa tccccatctg gctgggccgg aatgcccctg ctatcgacgg cgttttcccc 1020
gtgacgaccc cagacctgcg gtgcagaatc atcaacgcca ttctgggagg caacctgggc 1080
ctgagcctga cacctgccga ctgtgtgacc tgggactctg ccgtgggcac cctgttcgtg 1140
cggacacacg gacagttccc tatgcaccag ctgggcacag tgatccaggg catcgtgaac 1200
caggagggcg tggctaccgc ttatacactg ggcatgatgc tgagcggcca gaattacccc 1260
ctcgtgagcg gcatcatcag aggctacctg cccggccagg ccgtggtgac cgcccttcag 1320
cagcgcctgg accaggaggt ggatgaccag gccagggctg aaaccttcat ccagcacctg 1380
aacgctgtgt acgagatcct gggcctcaac gccagaggac aatctatcag agccagcgtg 1440
acaccgcaac ctcggccaag ccggggccgc ggcagaggcc agtctacacc tagaccttcc 1500
cagggccctg tgagttcagg acggggcaga cagcggcctg ccagcggcca gtacgacaga 1560
ggcagcaaca accagaacca agaccagggt aacaccagcc agggcggcta caacctgaga 1620
ccaagaacct accagcctca gagatacggc ggcggaagag gtcggagatg gaacgagaac 1680
accaacagcc aggagagcag acccagcgat cagggctccc agacaccccg gcctaaccaa 1740
gctggcagcg gcgtcagagg caaccagagc cagaccccta gacccgccgc cggcagagga 1800
ggcagaggca atcagaatag aaaccagcgg tctagcggag ccggcgatag cagagccgtc 1860
aacacagtga cccagagtgc cacgtcctcc acagatgaat cctcttcagc tgttgcaacc 1920
gcttccagcg gagatcaaag gaactaaggt gccagagccg tcaacacagt gacccagggc 1980
ggcagcccaa agaagaagcg gaaggtctct agacaagaga tcaagagaat caacaagatc 2040
agaaggagac tggtcaagga cagcaacaca aagaaggccg gcaagacagg ccccatgaaa 2100
accctgctcg tcagagtgat gacccctgac ctgagagagc ggctggaaaa cctgagaaag 2160
aagcccgaga acatccctca gcctatcagc aacaccagca gggccaacct gaacaagctg 2220
ctgaccgact acaccgagat gaagaaagcc atcctgcacg tgtactggga agagttccag 2280
aaagaccccg tgggcctgat gagcagagtt gctcagcctg ccagcaagaa gatcgaccag 2340
aacaagctga agcccgagat ggacgagaag ggcaatctga ccacagccgg ctttgcctgc 2400
tctcagtgtg gccagcctct gttcgtgtac aagctggaac aggtgtccga gaaaggcaag 2460
gcctacacca actacttcgg cagatgtaac gtggccgagc acgagaagct gattctgctg 2520
gcccagctga aacctgagaa ggactctgat gaggccgtga cctacagcct gggcaagttt 2580
ggacagagag ccctggactt ctacagcatc cacgtgacca aagaaagcac acaccccgtg 2640
aagcccctgg ctcagatcgc cggcaataga tacgcctctg gacctgtggg caaagccctg 2700
tccgatgcct gcatgggaac aatcgccagc ttcctgagca agtaccagga catcatcatc 2760
gagcaccaga aggtggtcaa gggcaaccag aagagactgg aaagcctgag ggagctggcc 2820
ggcaaagaga acctggaata ccccagcgtg accctgcctc ctcagcctca cacaaaagaa 2880
ggcgtggacg cctacaacga agtgatcgcc agagtgagaa tgtgggtcaa cctgaacctg 2940
tggcagaagc tgaaactgtc cagggacgac gccaagcctc tgctgagact gaagggcttc 3000
cctagcttcc ctctggtgga aagacaggcc aatgaagtgg attggtggga catggtctgc 3060
aacgtgaaga agctgatcaa cgagaagaaa gaggatggca aggttttctg gcagaacctg 3120
gccggctaca agagacaaga agccctgagg ccttacctga gcagcgaaga ggaccggaag 3180
aagggcaaga agttcgccag ataccagctg ggcgacctgc tgctgcacct ggaaaagaag 3240
cacggcgagg actggggcaa agtgtacgat gaggcctggg agagaatcga caagaaggtg 3300
gaaggcctga gcaagcacat taagctggaa gaggaaagaa ggagcgagga cgcccaatct 3360
aaagccgctc tgaccgattg gctgagagcc aaggccagct ttgtgatcga gggcctgaaa 3420
gaggccgaca aggacgagtt ctgcagatgc gagctgaagc tgcagaagtg gtacggcgat 3480
ctgagaggca agcccttcgc cattgaggcc gagaacagca tcctggacat cagcggcttc 3540
agcaagcagt acaactgcgc cttcatttgg cagaaagacg gcgtcaagaa actgaacctg 3600
tacctgatca tcaattactt caaaggcggc aagctgcggt tcaagaagat caaacccgag 3660
gccttcgagg ctaacagatt ctacaccgtg atcaacaaaa agtccggcga gatcgtgccc 3720
atggaagtga acttcaactt cgacgacccc aacctgatta tcctgcctct ggccttcggc 3780
aagagacagg gcagagagtt catctggaac gatctgctga gcctggaaac cggctctctg 3840
aagctggcca atggcagagt gatcgagaaa accctgtaca acaggagaac cagacaggac 3900
gagcctgctc tgtttgtggc cctgaccttc gagagaagag aggtgctgga cagcagcaac 3960
atcaagccca tgaacctgat cggcgtggac cggggcgaga atatccctgc tgtgatcgcc 4020
ctgacagacc ctgaaggatg cccactgagc agattcaagg actccctggg caaccctaca 4080
cacatcctga gaatcggcga gagctacaaa gagaagcaga ggacaatcca ggccaagaaa 4140
gaggtggaac agagaagagc cggcggatac tctaggaagt acgccagcaa ggccaagaat 4200
ctggccgacg acatggtccg aaacaccgcc agagatctgc tgtactacgc cgtgacacag 4260
gacgccatgc tgatcttcga gaatctgagc agaggcttcg gccggcaggg caagagaacc 4320
tttatggccg agaggcagta caccagaatg gaagattggc tcacagctaa actggcctac 4380
gagggactga gcaagaccta cctgtccaaa acactggccc agtatacctc caagacctgc 4440
agcaattgcg gcttcaccat caccagcgcc gactacgaca gagtgctgga aaagctcaag 4500
aaaaccgcca ccggctggat gaccaccatc aacggcaaag agctgaaggt tgagggccag 4560
atcacctact acaacaggta caagaggcag aacgtcgtga aggatctgag cgtggaactg 4620
gacagactga gcgaagagag cgtgaacaac gacatcagca gctggacaaa gggcagatca 4680
ggcgaggctc tgagcctgct gaagaagagg tttagccaca gacctgtgca agagaagttc 4740
gtgtgcctga actgcggctt cgagacacac gccgatgaac aggctgccct gaacattgcc 4800
agaagctggc tgttcctgag aagccaagag tacaagaagt accagaccaa caagaccacc 4860
ggcaacaccg acaagagggc ctttgtggaa acctggcaga gcttctacag aaaaaagctg 4920
aaagaagtct ggaagcccgc cgtgactagt ccaaaaaaga agagaaaggt agccctcgag 4980
tacccatatg atgtccctga ctacgcttga 5010
<210> 1006
<211> 4663
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP81 plasmid sequence
<400> 1006
atggcccaga acgagacatt tgatcctgtg gccctgcagg gctactaccc tgctggcggc 60
atcctggccg acaatgacat tatcaacatc agattcacca gcggacagtg gggcatcggc 120
gatagatggc tgcaggtgcg gctgagactg gtggacccta atactggaca gcctctggct 180
cagcctgagt acgaggacac aggcctgcct gccgaaaaca ggggtatcgt ggtggccgtg 240
tcccacaacg ccgccagaaa tatcttcaac aacgtgcagc cagctggtgg ccccaacaga 300
cacggccctc tgcacgacgg ccaatttcaa gtgggcgacg atcccagcga gcacttcgtg 360
cctattgagg aaaacctgat cccccaggag atcgtgaacc tgggagcagc tagaagagaa 420
gtgcggctgc tgagagaaat gtgcgtgcgg ctgctgcacg tgagaagaca gatgatgggc 480
atgggcatgc ctggcgctat ccagcctcaa ccgccagtgg gccccctgcc cgcccctgcc 540
cagcccccta tccctggccc acctgtgcct ccccccgtgc ctccccccgc ccctccagcc 600
cctgtcaacc cccctgtccc tccagtgcag cctatccacc acctgcctat tacccacatc 660
cgggccgtga tcggcgagac acctgcccag atcagagatg tgcccctgtg gctggcccag 720
tccatccctg ccctgaccgg cgtttatcct gccatggacg ccggaacact gacaagactg 780
gtgaacgcga tcaccgccag acaccccgga ctcgctcttg gcatgaacga ggccggctcc 840
tggcacgagg ccgttcatct gatctggcag aggaccttcg gcgctacagc cctccatgcc 900
ttgtctgatg tgctgaaggg catcgcccag cggaacggcg tggtgatggc cctggaaatg 960
ggcctgatgt tcaccaacga cgactgggac ctgacctggt ctgtgatccg gagatgtctg 1020
cctggacaag ccagcgttgt gaccatccag gcccggctgg atgccctgcc aaacaaccag 1080
gccaggatca tccaggccgg ctttatcatc agagaggtgt acgaggtgct gggcctggac 1140
ccactgggcc ggccactgaa cttccctgga ggcctgaccc agcgagacac cgccgtgccc 1200
gtgaccagag gccggggccg cggaagaacc ggccctagaa gaggccctgt gctgcctgtc 1260
agcagcaacc agcgccggca agaaaccgca ggcggcaacc agcctcagac ccaaccccag 1320
cagcagaaca cattcagcaa tcagacaaat cagagaggaa accagcggca gtggcaaaat 1380
agaggaaccg acagccagag acggtacttc ttcagaccca gaccaagcca gcctcagcgg 1440
tacggcagca accagggccc tgacaaccct aatccctaca gaggaagaga tagcaccaat 1500
caaagcggcc aggagcggca gctgcctcag cagcaacagg gctctagaag gggccctggc 1560
agaaacacaa acagcggcaa caacaccgtg cacaccgtgc ggcaagtgga atcttctcag 1620
ctacaacaaa ggcggcagcc caaagaagaa gcggaaggtc tctagacaag agatcaagag 1680
aatcaacaag atcagaagga gactggtcaa ggacagcaac acaaagaagg ccggcaagac 1740
aggccccatg aaaaccctgc tcgtcagagt gatgacccct gacctgagag agcggctgga 1800
aaacctgaga aagaagcccg agaacatccc tcagcctatc agcaacacca gcagggccaa 1860
cctgaacaag ctgctgaccg actacaccga gatgaagaaa gccatcctgc acgtgtactg 1920
ggaagagttc cagaaagacc ccgtgggcct gatgagcaga gttgctcagc ctgccagcaa 1980
gaagatcgac cagaacaagc tgaagcccga gatggacgag aagggcaatc tgaccacagc 2040
cggctttgcc tgctctcagt gtggccagcc tctgttcgtg tacaagctgg aacaggtgtc 2100
cgagaaaggc aaggcctaca ccaactactt cggcagatgt aacgtggccg agcacgagaa 2160
gctgattctg ctggcccagc tgaaacctga gaaggactct gatgaggccg tgacctacag 2220
cctgggcaag tttggacaga gagccctgga cttctacagc atccacgtga ccaaagaaag 2280
cacacacccc gtgaagcccc tggctcagat cgccggcaat agatacgcct ctggacctgt 2340
gggcaaagcc ctgtccgatg cctgcatggg aacaatcgcc agcttcctga gcaagtacca 2400
ggacatcatc atcgagcacc agaaggtggt caagggcaac cagaagagac tggaaagcct 2460
gagggagctg gccggcaaag agaacctgga ataccccagc gtgaccctgc ctcctcagcc 2520
tcacacaaaa gaaggcgtgg acgcctacaa cgaagtgatc gccagagtga gaatgtgggt 2580
caacctgaac ctgtggcaga agctgaaact gtccagggac gacgccaagc ctctgctgag 2640
actgaagggc ttccctagct tccctctggt ggaaagacag gccaatgaag tggattggtg 2700
ggacatggtc tgcaacgtga agaagctgat caacgagaag aaagaggatg gcaaggtttt 2760
ctggcagaac ctggccggct acaagagaca agaagccctg aggccttacc tgagcagcga 2820
agaggaccgg aagaagggca agaagttcgc cagataccag ctgggcgacc tgctgctgca 2880
cctggaaaag aagcacggcg aggactgggg caaagtgtac gatgaggcct gggagagaat 2940
cgacaagaag gtggaaggcc tgagcaagca cattaagctg gaagaggaaa gaaggagcga 3000
ggacgcccaa tctaaagccg ctctgaccga ttggctgaga gccaaggcca gctttgtgat 3060
cgagggcctg aaagaggccg acaaggacga gttctgcaga tgcgagctga agctgcagaa 3120
gtggtacggc gatctgagag gcaagccctt cgccattgag gccgagaaca gcatcctgga 3180
catcagcggc ttcagcaagc agtacaactg cgccttcatt tggcagaaag acggcgtcaa 3240
gaaactgaac ctgtacctga tcatcaatta cttcaaaggc ggcaagctgc ggttcaagaa 3300
gatcaaaccc gaggccttcg aggctaacag attctacacc gtgatcaaca aaaagtccgg 3360
cgagatcgtg cccatggaag tgaacttcaa cttcgacgac cccaacctga ttatcctgcc 3420
tctggccttc ggcaagagac agggcagaga gttcatctgg aacgatctgc tgagcctgga 3480
aaccggctct ctgaagctgg ccaatggcag agtgatcgag aaaaccctgt acaacaggag 3540
aaccagacag gacgagcctg ctctgtttgt ggccctgacc ttcgagagaa gagaggtgct 3600
ggacagcagc aacatcaagc ccatgaacct gatcggcgtg gaccggggcg agaatatccc 3660
tgctgtgatc gccctgacag accctgaagg atgcccactg agcagattca aggactccct 3720
gggcaaccct acacacatcc tgagaatcgg cgagagctac aaagagaagc agaggacaat 3780
ccaggccaag aaagaggtgg aacagagaag agccggcgga tactctagga agtacgccag 3840
caaggccaag aatctggccg acgacatggt ccgaaacacc gccagagatc tgctgtacta 3900
cgccgtgaca caggacgcca tgctgatctt cgagaatctg agcagaggct tcggccggca 3960
gggcaagaga acctttatgg ccgagaggca gtacaccaga atggaagatt ggctcacagc 4020
taaactggcc tacgagggac tgagcaagac ctacctgtcc aaaacactgg cccagtatac 4080
ctccaagacc tgcagcaatt gcggcttcac catcaccagc gccgactacg acagagtgct 4140
ggaaaagctc aagaaaaccg ccaccggctg gatgaccacc atcaacggca aagagctgaa 4200
ggttgagggc cagatcacct actacaacag gtacaagagg cagaacgtcg tgaaggatct 4260
gagcgtggaa ctggacagac tgagcgaaga gagcgtgaac aacgacatca gcagctggac 4320
aaagggcaga tcaggcgagg ctctgagcct gctgaagaag aggtttagcc acagacctgt 4380
gcaagagaag ttcgtgtgcc tgaactgcgg cttcgagaca cacgccgatg aacaggctgc 4440
cctgaacatt gccagaagct ggctgttcct gagaagccaa gagtacaaga agtaccagac 4500
caacaagacc accggcaaca ccgacaagag ggcctttgtg gaaacctggc agagcttcta 4560
cagaaaaaag ctgaaagaag tctggaagcc cgccgtgact agtccaaaaa agaagagaaa 4620
ggtagccctc gagtacccat atgatgtccc tgactacgct tga 4663
<210> 1007
<211> 4528
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP82 plasmid sequence
<400> 1007
atggcccggg aactgaaccc cctgcagctg caacagctgt acatcaacaa tggcctgcag 60
cccaatcccg gccacggaga tatcatcgca gttagattca caggcggccc ttggggcccc 120
ggagatagat gggccagagt gaccatccgg ctgcaggaca acaccggcca gcctctgcaa 180
gtgcccggat acgacctgga gcctggcatc atcaatctgc gggaagatat cctgatcgcc 240
ggcccataca acctcatcag aacagctttt ctggacctgg aacctgccag aggaccagag 300
cggcacggcc cgttcggcga cggcagactg cagcctggcg atggactgag cgagggattt 360
cagcctatca ccgacgagga aatccaggct gaagtgggca ccatcggcgc cgcccgtaac 420
gagatccggc tgctgagaga agccttgcag agactccagg ctggcggtgt tggacggcct 480
atccctgggg ccgtgctgca gcctcaacct gtgatcggac ctgtgatccc catcaaccac 540
ctgagaagcg tgattggcaa cacacctcct aaccccagag atgtggccct gtggttgggc 600
agatctacag ccgctatcga gggcgtgttc cccatcgtgg accaggtgac ccggatgaga 660
gtggtgaacg ccctggtcgc ctctcatcct ggcctgaccc tgacagagaa cgaggccggc 720
agctggaacg ccgccatcag cgccctgtgg cggaaggccc acggcgctgc tgctcagcac 780
gagctggccg gagtgctgag cgacatcaac aagaaggaag gcatccagac agccttcaac 840
ctgggcatgc agttcaccga tggcaattgg tccctggtgt ggggaatcat caggaccctg 900
ctgcccggcc aggccctggt cacaaacgcc cagagccagt tcgacctgat gggcgacgac 960
attcagcggg ccgagaactt ccccagagtg attaacaacc tgtacaccat gctgggcctg 1020
aacatccacg gccagagcat cagacctaga gtgcagaccc agcctctgca gaccagacct 1080
cggaaccctg gcagaagcca gcagggtcag ctgaatcagc ctcggcctca gaacagagcc 1140
aaccagtcct acagaccccc tcggcagcag caacaacaca gcgacgtgcc tgagcagagg 1200
gaccagagag gcccatctca accgcctaga ggctctggcg gaggctataa cttcagaaga 1260
aatccccagc agcctcagcg gtacggccaa ggcccccccg gcccaaaccc ttacagacgg 1320
ttcggcgacg gcggcaatcc ccagcagcaa ggcccgcctc caaatagagg ccctgatcag 1380
ggacctagac caggcggcaa ccctcgcggc ggcggcaggg ggcagggccc ccggaacggc 1440
ggaggcagcg ccgccgccgt gcacaccgtg aaagccagcg aaaacgaaac taaaaggcgg 1500
cagcccaaag aagaagcgga aggtctctag acaagagatc aagagaatca acaagatcag 1560
aaggagactg gtcaaggaca gcaacacaaa gaaggccggc aagacaggcc ccatgaaaac 1620
cctgctcgtc agagtgatga cccctgacct gagagagcgg ctggaaaacc tgagaaagaa 1680
gcccgagaac atccctcagc ctatcagcaa caccagcagg gccaacctga acaagctgct 1740
gaccgactac accgagatga agaaagccat cctgcacgtg tactgggaag agttccagaa 1800
agaccccgtg ggcctgatga gcagagttgc tcagcctgcc agcaagaaga tcgaccagaa 1860
caagctgaag cccgagatgg acgagaaggg caatctgacc acagccggct ttgcctgctc 1920
tcagtgtggc cagcctctgt tcgtgtacaa gctggaacag gtgtccgaga aaggcaaggc 1980
ctacaccaac tacttcggca gatgtaacgt ggccgagcac gagaagctga ttctgctggc 2040
ccagctgaaa cctgagaagg actctgatga ggccgtgacc tacagcctgg gcaagtttgg 2100
acagagagcc ctggacttct acagcatcca cgtgaccaaa gaaagcacac accccgtgaa 2160
gcccctggct cagatcgccg gcaatagata cgcctctgga cctgtgggca aagccctgtc 2220
cgatgcctgc atgggaacaa tcgccagctt cctgagcaag taccaggaca tcatcatcga 2280
gcaccagaag gtggtcaagg gcaaccagaa gagactggaa agcctgaggg agctggccgg 2340
caaagagaac ctggaatacc ccagcgtgac cctgcctcct cagcctcaca caaaagaagg 2400
cgtggacgcc tacaacgaag tgatcgccag agtgagaatg tgggtcaacc tgaacctgtg 2460
gcagaagctg aaactgtcca gggacgacgc caagcctctg ctgagactga agggcttccc 2520
tagcttccct ctggtggaaa gacaggccaa tgaagtggat tggtgggaca tggtctgcaa 2580
cgtgaagaag ctgatcaacg agaagaaaga ggatggcaag gttttctggc agaacctggc 2640
cggctacaag agacaagaag ccctgaggcc ttacctgagc agcgaagagg accggaagaa 2700
gggcaagaag ttcgccagat accagctggg cgacctgctg ctgcacctgg aaaagaagca 2760
cggcgaggac tggggcaaag tgtacgatga ggcctgggag agaatcgaca agaaggtgga 2820
aggcctgagc aagcacatta agctggaaga ggaaagaagg agcgaggacg cccaatctaa 2880
agccgctctg accgattggc tgagagccaa ggccagcttt gtgatcgagg gcctgaaaga 2940
ggccgacaag gacgagttct gcagatgcga gctgaagctg cagaagtggt acggcgatct 3000
gagaggcaag cccttcgcca ttgaggccga gaacagcatc ctggacatca gcggcttcag 3060
caagcagtac aactgcgcct tcatttggca gaaagacggc gtcaagaaac tgaacctgta 3120
cctgatcatc aattacttca aaggcggcaa gctgcggttc aagaagatca aacccgaggc 3180
cttcgaggct aacagattct acaccgtgat caacaaaaag tccggcgaga tcgtgcccat 3240
ggaagtgaac ttcaacttcg acgaccccaa cctgattatc ctgcctctgg ccttcggcaa 3300
gagacagggc agagagttca tctggaacga tctgctgagc ctggaaaccg gctctctgaa 3360
gctggccaat ggcagagtga tcgagaaaac cctgtacaac aggagaacca gacaggacga 3420
gcctgctctg tttgtggccc tgaccttcga gagaagagag gtgctggaca gcagcaacat 3480
caagcccatg aacctgatcg gcgtggaccg gggcgagaat atccctgctg tgatcgccct 3540
gacagaccct gaaggatgcc cactgagcag attcaaggac tccctgggca accctacaca 3600
catcctgaga atcggcgaga gctacaaaga gaagcagagg acaatccagg ccaagaaaga 3660
ggtggaacag agaagagccg gcggatactc taggaagtac gccagcaagg ccaagaatct 3720
ggccgacgac atggtccgaa acaccgccag agatctgctg tactacgccg tgacacagga 3780
cgccatgctg atcttcgaga atctgagcag aggcttcggc cggcagggca agagaacctt 3840
tatggccgag aggcagtaca ccagaatgga agattggctc acagctaaac tggcctacga 3900
gggactgagc aagacctacc tgtccaaaac actggcccag tatacctcca agacctgcag 3960
caattgcggc ttcaccatca ccagcgccga ctacgacaga gtgctggaaa agctcaagaa 4020
aaccgccacc ggctggatga ccaccatcaa cggcaaagag ctgaaggttg agggccagat 4080
cacctactac aacaggtaca agaggcagaa cgtcgtgaag gatctgagcg tggaactgga 4140
cagactgagc gaagagagcg tgaacaacga catcagcagc tggacaaagg gcagatcagg 4200
cgaggctctg agcctgctga agaagaggtt tagccacaga cctgtgcaag agaagttcgt 4260
gtgcctgaac tgcggcttcg agacacacgc cgatgaacag gctgccctga acattgccag 4320
aagctggctg ttcctgagaa gccaagagta caagaagtac cagaccaaca agaccaccgg 4380
caacaccgac aagagggcct ttgtggaaac ctggcagagc ttctacagaa aaaagctgaa 4440
agaagtctgg aagcccgccg tgactagtcc aaaaaagaag agaaaggtag ccctcgagta 4500
cccatatgat gtccctgact acgcttga 4528
<210> 1008
<211> 4977
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP83 plasmid sequence
<400> 1008
atggccgctg tggaaggcga tctggacgtg caagccctga ccgatctgtt caacaacctg 60
ggcatcaacc gggacccccg gcaccgggaa gtgatcgccc tgcggatgac aggcggctgg 120
tggggccctg ccaccagata caacctgatc accgtgctgc tgcaggatga tcagggtcag 180
cctcttcagc agccccggtg gcgggccgag ggccgggccg ccaaccccgc tgtgatgctg 240
accctggaag ccccatggca ggacctgcgg atggcctttg acaacgtcga cctggccgac 300
gacacactgc ggtttggccc tctggctaac ggcaattaca tccccggcga cgagtacagc 360
ctggagttca tccctcccgc catgcaagag atcgcccaaa tgcagagaga tgagctggaa 420
aacgtgctgg acattgtggg ccagatcaca atgcagatga gcgacctgat cggaatgcag 480
gacgcccaga tccggggcct ggagggccaa atcagaggcc tgagaggcaa tctgcccgtg 540
gccggaacac caccacctcc tcctccaagc ctggacctgc agcctgccgc cgccagcagc 600
ccttacgtgg cccctgcgtc tagcgctcct gccgcacccg tggcctctgc tgatctgggc 660
tggttcgccg ggggaccttc cccaggctct gtggaccctc ggctggcccg ggtcgcctac 720
aaccccttcc tgcccggacc tagcgacggc agcggcgtgg ccccggtgca gccctccgcc 780
cctcctgccg ccagccctct gctgcccctg ccacctgctc agcctgtgca gccagtgatc 840
cagtacgtgc accctcctcc tatgaaccct gcccagcaga ttattcctat ccagcacatc 900
agagccgtga ccggcaacgc ccccaccaac cctagagaga tccctatgtg gatcggcaga 960
aacgccagcg ccatcgaggg cgtgttcccc atgaccaccc ctgatctgag gtgtcgggtg 1020
atcaacgccc tgctcggcgg caacctgggc ctgaacctgg aaccacagca ctgcgtgacc 1080
tgggccagcg caatcgccac cctgtacgtt agaacccacg gcagctaccc catccaccag 1140
ctggctgaag tgctgagagg cgtggctaat agcgagggag ttgctgccgc ttatcagctg 1200
ggcatgatgc tgacaaaccg ggattacaac ctgatctggg ggatcatccg ccctctgctg 1260
cccggccagg ccgtcgtgac cgccatgcag catagactgg atcaggagat caacgacgcc 1320
gccagagtgg cctctttcat caatcacctg aacggcgtgt acgagctgct gggcttgaac 1380
gccagaggcc agagcctgag aatccctgcc tctggcggac agaccacggc cggaaccagc 1440
gccggcagag gcacaagagg aagacgcagc cagcaaggca cacctggcag acagagcagc 1500
ggccagagcc agcagcaggg aagaagaagc agccagggcc agagcagaca gtcagactcc 1560
agcgaccaga acgtgcagag acaatcccag ggcggcaacg gacggggagg ctataatctg 1620
agacccagga cctaccagcc ccagagatac ggcggaggca gaggcagaag gtggaacgac 1680
cagcctgcca gatcagacaa ccagcagcgg tcccaatctc aacagcctca gtccgaggct 1740
agaggcgagc agagcagaac cagcggagcc ggcagaggac agggcggccg ggggaatcaa 1800
aacagaaacc agagaagcgc cggtggcaat gccgacagaa cagtgaacac cgtgacaacc 1860
gccagcgctt ctacaagcgc ctcaggtcaa gatggatcct ctccagctcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977
<210> 1009
<211> 4977
<212> DNA
<213> Artificial Sequence
<220>
<223> pXDP84 plasmid sequence
<400> 1009
atggccgcca tcgagggcga tctggacgtg caggccctgg ctaacctgtt caacgacctg 60
ggcatcaaca gaaaccccag acacagagag gtgattgccc tgagaatgac cggcggctgg 120
tggggccccg ctaccagata taatctggtg agcctgctgc tgcaggacga ccagggccag 180
cctctgccac agcccagatg gcgggctgaa ggcagagccg caaaccccgc cgtgatgttc 240
accctggaag ccccctggca ggatctgaga ctggcctttg acaatatcga cgtgggcgag 300
ggcacactga gattcggccc acttgctaac ggcaactaca tccccggcga cgagttcagc 360
ctggagttcc tgcctcctgc catgcaggag atcacacaga tgcagagaga tgagctggag 420
gaagtgctgg atgtggtggg ccagatcaca atgcagatga acgacctgat cggcatgcag 480
gacgcccaga tccggggact ggaaggacaa ctgagaggac tgagaggcaa tctgccagtg 540
gccggcacac ctccacctcc tccacccagc ctggacctgc agcctgctgc cgccagcagc 600
ccctacgtgg cccctgcacc ttccgctcct gctgcctctg ccgccgcagc cgacctggga 660
tggttcgccg gaggccctgg ccctggatct ctggaccccc gcctcgcccg ggtggcctac 720
aacccctttc tgcctggccc tagcgacggc agcggtgccg ctcccgccca gcctagcgct 780
cctccggtgg cctctcctct gccttctctg ctgcctgccc agcccatgca acctgtgatc 840
cagtacgtgc accccccacc tatcaatcct gctcaacagg tgatccctat tcagcatatc 900
agagccgtga ccggcaacgc ccctagcaac ccaagagaaa tccctatgtg gatcggaaga 960
aacgccagcg ccatcgaggg cgtgttcccc atccctacat ctgacatccg ttctagagtg 1020
atcaacgccc tgctgggtag acagctgggc ctgaacctgg atcctcagca ctgcatcacc 1080
tgggccagcg caatcgccac tctgtacgtg cgcacccacg gcagctaccc tctgcaccag 1140
ctggccgagg ttctgcggag agtctccaac agcgaaggcg cggccgccgc ctggcagctg 1200
ggcatgatgc tgaccaacca ggactacaac ctcgtgtggg gaatggtcag acccctgctg 1260
cccggccagg ctgtggtcac cgccatgcag caccggctgg atcaggaggt ttctgatgcc 1320
gccagaatcg tgtccttcgt gaaccacctg aacgccgtgt acgagctgct gggcctgaat 1380
gccagaggcc agaacctcag ggtctccacc ggcggccaga ccaccgctag aacaagcgcc 1440
ggcagaggcg ccagaggcag acggtcccag caggggaccc ctggcaggca gtctagcgga 1500
caggcccctc ctcaaggccg gagaagcagc cagggccagc agcctaggca gtctgagagc 1560
ggcgaccaga acaaccagcg gcagctccag ggaggaaaca accggggcgg ctataacctg 1620
cggcctcgga cataccagcc tcagcggtac gggggaggcc ggggccggag atggaacgat 1680
cagaccgcca gagccgataa ccagcagcgg agccaatccc aacaacctca gagcgaggcc 1740
cggggcgagc agagcagaac cagcggcgcc ggcagagaac agggcggcag aggcaatcaa 1800
aatcggaatc aaagatctgc cggagaaaac accgacagat ccgtgaacac cgtgacagcc 1860
accagcgcca gcatcagcgc ctcaggtcaa aatggatcct ctacaactcc tccagcctct 1920
ggaagcggaa atcaagggaa ctaaggcggc agcccaaaga agaagcggaa ggtctctaga 1980
caagagatca agagaatcaa caagatcaga aggagactgg tcaaggacag caacacaaag 2040
aaggccggca agacaggccc catgaaaacc ctgctcgtca gagtgatgac ccctgacctg 2100
agagagcggc tggaaaacct gagaaagaag cccgagaaca tccctcagcc tatcagcaac 2160
accagcaggg ccaacctgaa caagctgctg accgactaca ccgagatgaa gaaagccatc 2220
ctgcacgtgt actgggaaga gttccagaaa gaccccgtgg gcctgatgag cagagttgct 2280
cagcctgcca gcaagaagat cgaccagaac aagctgaagc ccgagatgga cgagaagggc 2340
aatctgacca cagccggctt tgcctgctct cagtgtggcc agcctctgtt cgtgtacaag 2400
ctggaacagg tgtccgagaa aggcaaggcc tacaccaact acttcggcag atgtaacgtg 2460
gccgagcacg agaagctgat tctgctggcc cagctgaaac ctgagaagga ctctgatgag 2520
gccgtgacct acagcctggg caagtttgga cagagagccc tggacttcta cagcatccac 2580
gtgaccaaag aaagcacaca ccccgtgaag cccctggctc agatcgccgg caatagatac 2640
gcctctggac ctgtgggcaa agccctgtcc gatgcctgca tgggaacaat cgccagcttc 2700
ctgagcaagt accaggacat catcatcgag caccagaagg tggtcaaggg caaccagaag 2760
agactggaaa gcctgaggga gctggccggc aaagagaacc tggaataccc cagcgtgacc 2820
ctgcctcctc agcctcacac aaaagaaggc gtggacgcct acaacgaagt gatcgccaga 2880
gtgagaatgt gggtcaacct gaacctgtgg cagaagctga aactgtccag ggacgacgcc 2940
aagcctctgc tgagactgaa gggcttccct agcttccctc tggtggaaag acaggccaat 3000
gaagtggatt ggtgggacat ggtctgcaac gtgaagaagc tgatcaacga gaagaaagag 3060
gatggcaagg ttttctggca gaacctggcc ggctacaaga gacaagaagc cctgaggcct 3120
tacctgagca gcgaagagga ccggaagaag ggcaagaagt tcgccagata ccagctgggc 3180
gacctgctgc tgcacctgga aaagaagcac ggcgaggact ggggcaaagt gtacgatgag 3240
gcctgggaga gaatcgacaa gaaggtggaa ggcctgagca agcacattaa gctggaagag 3300
gaaagaagga gcgaggacgc ccaatctaaa gccgctctga ccgattggct gagagccaag 3360
gccagctttg tgatcgaggg cctgaaagag gccgacaagg acgagttctg cagatgcgag 3420
ctgaagctgc agaagtggta cggcgatctg agaggcaagc ccttcgccat tgaggccgag 3480
aacagcatcc tggacatcag cggcttcagc aagcagtaca actgcgcctt catttggcag 3540
aaagacggcg tcaagaaact gaacctgtac ctgatcatca attacttcaa aggcggcaag 3600
ctgcggttca agaagatcaa acccgaggcc ttcgaggcta acagattcta caccgtgatc 3660
aacaaaaagt ccggcgagat cgtgcccatg gaagtgaact tcaacttcga cgaccccaac 3720
ctgattatcc tgcctctggc cttcggcaag agacagggca gagagttcat ctggaacgat 3780
ctgctgagcc tggaaaccgg ctctctgaag ctggccaatg gcagagtgat cgagaaaacc 3840
ctgtacaaca ggagaaccag acaggacgag cctgctctgt ttgtggccct gaccttcgag 3900
agaagagagg tgctggacag cagcaacatc aagcccatga acctgatcgg cgtggaccgg 3960
ggcgagaata tccctgctgt gatcgccctg acagaccctg aaggatgccc actgagcaga 4020
ttcaaggact ccctgggcaa ccctacacac atcctgagaa tcggcgagag ctacaaagag 4080
aagcagagga caatccaggc caagaaagag gtggaacaga gaagagccgg cggatactct 4140
aggaagtacg ccagcaaggc caagaatctg gccgacgaca tggtccgaaa caccgccaga 4200
gatctgctgt actacgccgt gacacaggac gccatgctga tcttcgagaa tctgagcaga 4260
ggcttcggcc ggcagggcaa gagaaccttt atggccgaga ggcagtacac cagaatggaa 4320
gattggctca cagctaaact ggcctacgag ggactgagca agacctacct gtccaaaaca 4380
ctggcccagt atacctccaa gacctgcagc aattgcggct tcaccatcac cagcgccgac 4440
tacgacagag tgctggaaaa gctcaagaaa accgccaccg gctggatgac caccatcaac 4500
ggcaaagagc tgaaggttga gggccagatc acctactaca acaggtacaa gaggcagaac 4560
gtcgtgaagg atctgagcgt ggaactggac agactgagcg aagagagcgt gaacaacgac 4620
atcagcagct ggacaaaggg cagatcaggc gaggctctga gcctgctgaa gaagaggttt 4680
agccacagac ctgtgcaaga gaagttcgtg tgcctgaact gcggcttcga gacacacgcc 4740
gatgaacagg ctgccctgaa cattgccaga agctggctgt tcctgagaag ccaagagtac 4800
aagaagtacc agaccaacaa gaccaccggc aacaccgaca agagggcctt tgtggaaacc 4860
tggcagagct tctacagaaa aaagctgaaa gaagtctgga agcccgccgt gactagtcca 4920
aaaaagaaga gaaaggtagc cctcgagtac ccatatgatg tccctgacta cgcttga 4977
<210> 1010
<211> 5
<212> PRT
<213> Unknown
<220>
<223> TEV protease cleavage site
<400> 1010
Leu Phe Gln Gly Pro
1 5
Claims (296)
- 다음을 인코딩하는 하나 이상의 핵산을 포함하는 전달 입자(XDP) 시스템:
(a) 하나 이상의 레트로바이러스 성분;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제1항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제2항에 있어서, 상기 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제2항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질과 핵산 둘 모두를 포함하는, XDP 시스템.
- 제5항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, 리보뉴클레아제(RNAse), 데옥시리보뉴클레아제(DNAse), 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해성 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제6항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제7항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제8항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제9항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제5항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 시스템.
- 제11항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 시스템.
- 제12항에 있어서, 상기 스캐폴드 서열은 표 3에 제시된 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제13항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제1항 내지 제14항 중 어느 한 항에 있어서, 상기 핵산은:
(a) 레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 하나 이상의 프로테아제 절단 부위;
(c) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질(gag-TFR-PR);
(d) 레트로바이러스 gag-pol 폴리단백질; 및
(e) 프로테아제 절단 부위를 절단할 수 있는 비-레트로바이러스 프로테아제로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템. - 제1항 내지 제15항 중 어느 한 항에 있어서, 하나 이상의 상기 레트로바이러스 성분은 오르토레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 시스템.
- 제16항에 있어서, 상기 오르소레트로바이러스아과 바이러스가 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
- 제16항에 있어서, 상기 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 또는 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 시스템.
- 제1항 내지 제18항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제19항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제19항 또는 제20항에 있어서, 상기 하나 이상의 레트로바이러스 성분은 표 5에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782 및 234-339로 구성된 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제1항 내지 제21항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제22항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제23항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제22항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제25항에 있어서, 상기 향성 인자는 XDP와 표적 세포의 세포 표면과의 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 알파레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제27항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제28항에 있어서, 상기 gag 폴리단백질은 N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), P2A 펩티드, P2B 펩티드, P10 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
- 제27항 내지 제29항 중 어느 한 항에 있어서, 상기 하나 이상의 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 상기 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템. - 제27항 내지 제30항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제31항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제31항에 있어서, 상기 향성 인자는 표 4에 제시된 바와 같은 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 서열의 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 시스템.
- 제33항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G이고, 선택적으로 VSV-G 당단백질은 서열번호: 438의 서열을 포함하는, XDP 시스템.
- 제27항 내지 제34항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제35항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제36항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제37항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제38항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제39항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제39항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제39항 내지 제41항 중 어느 한 항에 있어서, 상기 CasX는 PKKKRKV(서열번호: 130), KRPAATKKAGQAKKKK(서열번호: 131), PAAKRVKLD(서열번호: 132), RQRRNELKRSP(서열번호: 133), NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(서열번호: 134), RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(서열번호: 135), VSRKRPRP(서열번호: 136), PPKKARED(서열번호: 137), PQPKKKPL(서열번호: 138), SALIKKKKKMAP(서열번호: 139), DRLRR(서열번호: 140), PKQKKRK(서열번호: 141), RKLKKKIKKL(서열번호: 142), REKKKFLKRR(서열번호: 143), KRKGDEVDGVDEVAKKKSKK(서열번호: 144), RKCLQAGMNLEARKTKK(서열번호: 145), PRPRKIPR(서열번호: 146), PPRKKRTVV(서열번호: 147), NLSKKKKRKREK(서열번호: 148), RRPSRPFRKP(서열번호: 149), KRPRSPSS(서열번호: 150), KRGINDRNFWRGENERKTR(서열번호: 151), PRPPKMARYDN(서열번호: 152), KRSFSKAF(서열번호: 153), KLKIKRPVK(서열번호: 154), PKTRRRPRRSQRKRPPT(서열번호: 156), RRKKRRPRRKKRR(서열번호: 159), PKKKSRKPKKKSRK(서열번호: 160), HKKKHPDASVNFSEFSK(서열번호: 161), QRPGPYDRPQRPGPYDRP(서열번호: 162), LSPSLSPLLSPSLSPL(서열번호: 163), RGKGGKGLGKGGAKRHRK(서열번호: 164), PKRGRGRPKRGRGR(서열번호: 165), MSRRRKANPTKLSENAKKLAKEVEN(서열번호: 157), PKKKRKVPPPPAAKRVKLD(서열번호: 155), 및 PKKKRKVPPPPKKKRKV(서열번호: 166)로 구성된 서열의 군으로부터 선택되는 하나 이상의 NLS를 추가로 포함하며, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제35항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
- 제43항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
- 제44항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제45항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제44항 내지 제46항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제27항 내지 제47항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제48항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성된, XDP 시스템.
- 제48항 또는 제49항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제27항 내지 제50항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제51항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제52항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제51항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제54항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 XDP의 표적 세포 내로의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 베타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제56항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제56항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로 매트릭스 폴리펩티드(MA), PP21/24 펩티드, P12/P3/P8 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
- 제56항 내지 제58항 중 어느 한 항에 있어서, 상기 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 추가로 인코딩하는, XDP 시스템. - 제56항 내지 제59항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제60항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제61항에 있어서, 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
- 제62항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
- 제56항 내지 제63항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제64항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제65항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제66항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제67항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제68항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397, 또는 11의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제68항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제68항 내지 제70항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제64항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성되는 군으로부터 선택된 핵산인, XDP 시스템.
- 제72항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
- 제73항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제73항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제73항 내지 제75항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제56항 내지 제76항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제77항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제77항 또는 제78항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제56항 내지 제79항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제80항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제81항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제80항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제83항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 델타레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제85항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제86항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
- 제85항 내지 제87항 중 어느 한 항에 있어서, 상기 핵산은,
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템. - 제85항 내지 제88항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제89항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제89항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
- 제91항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
- 제85항 내지 제92항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제93항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제94항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제95항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택되는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제96항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제97항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제97항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제97항 내지 제99항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제93항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
- 제101항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
- 제102항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제102항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제102항 내지 제104항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제85항 내지 제105항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제106항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제106항 또는 제107항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제85항 내지 제108항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제109항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제110항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제109항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제112항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 엡실론레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제114항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제114항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p20 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
- 제114항 내지 제116항 중 어느 한 항에 있어서, 상기 핵산은,
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템. - 제114항 내지 제117항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제118항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제118항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
- 제120항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
- 제114항 내지 제121항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제122항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제123항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제124항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제125항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제126항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제126항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제126항 내지 제128항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제122항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
- 제130항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
- 제131항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제131항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제131항 내지 제133항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제114항 내지 제134항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제135항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제135항 또는 제136항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제114항 내지 제137항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제138항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제139항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제139항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제141항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 감마레트로바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제143항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제144항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), p12 펩티드, 캡시드 폴리펩티드(CA), 및 뉴클레오캡시드 폴리펩티드(NC)를 포함하는, XDP 시스템.
- 제143항 내지 제145항 중 어느 한 항에 있어서, 핵산은
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템. - 제143항 내지 제146항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제147항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제147항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
- 제149항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
- 제143항 내지 제150항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제151항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제152항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제153항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제154항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제155항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제155항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제155항 내지 제157항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제151항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
- 제159항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
- 제160항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제160항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제160항 내지 제162항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제143항 내지 제163항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제164항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제164항 또는 제165항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제164항 내지 제166항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제167항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제168항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제167항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제170항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 렌티바이러스 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제172항에 있어서, 상기 gag 폴리단백질은 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제173항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, 매트릭스 폴리펩티드(MA), 캡시드 폴리펩티드(CA), p2 펩티드, 뉴클레오캡시드 폴리펩티드(NC), p1 펩티드, 및 p6 펩티드를 포함하는, XDP 시스템.
- 제172항 내지 제173항 중 어느 한 항에 있어서, 상기 핵산은,
(a) Gag-Pol 폴리단백질;
(b) 하나 이상의 프로테아제 절단 부위;
(c) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(d) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템. - 제172항 내지 제175항 중 어느 한 항에 있어서, 상기 렌티바이러스는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV) 및 소 면역결핍 바이러스(BIV)로 구성된 군으로부터 선택되는, XDP 시스템.
- 제176항에 있어서, 상기 렌티바이러스는 HIV-1인, XDP 시스템
- 제172항 내지 제177항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제178항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제178항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
- 제180항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
- 제172항 내지 제181항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제182항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제183항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제184항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제185항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제186항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제186항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제186항 내지 제188항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제182항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
- 제190항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보적인, XDP 시스템.
- 제191항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제191항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제191항 내지 제193항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제172항 내지 제194항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제195항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제195항 또는 제196항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제195항 내지 제197항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되고 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제198항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제198항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체 (RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제198항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제201항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
- 다음 성분을 인코딩하는 하나 이상의 핵산을 포함하는 XDP 시스템:
(a) 스푸마레트로바이러스아과 gag 폴리단백질의 전부 또는 일부;
(b) 치료 페이로드; 및
(c) 향성 인자. - 제203항에 있어서, 상기 gag 폴리단백질은 p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드로 구성된 군으로부터 선택된 하나 이상의 성분을 포함하는, XDP 시스템.
- 제204항에 있어서, 상기 gag 폴리단백질은, N-말단으로부터 C-말단으로, p68 Gag 폴리펩티드 및 p3 Gag 폴리펩티드를 포함하는, XDP 시스템.
- 제203항 내지 제205항 중 어느 한 항에 있어서, 상기 핵산은,
(a) HIV p1 펩티드;
(b) HIV p6 펩티드;
(c) Gag-Pol 폴리단백질;
(d) 하나 이상의 프로테아제 절단 부위;
(e) 절단 부위를 절단할 수 있는 비-레트로바이러스 이종성 프로테아제; 및
(f) gag-트랜스프레임 영역-pol 프로테아제 폴리단백질로부터 선택된 하나 이상의 성분을 인코딩하는, XDP 시스템. - 제203항 내지 제206항 중 어느 한 항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 시스템.
- 제207항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 인코딩 서열 및 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 시스템.
- 제207항에 있어서, 상기 향성 인자는 서열번호: 437, 439, 441, 443, 445, 447, 449, 451, 453, 455, 457, 459, 461, 463, 465, 467, 469, 471, 473, 475, 477, 479, 481, 483, 485, 487, 489, 491, 493, 495, 497, 499, 501,, 503, 505, 507, 509, 511, 513, 515, 517, 519, 521, 523, 525, 527, 529, 531, 533, 535, 537, 539, 541, 543, 545, 547, 549, 551, 553, 555, 557, 559, 561, 563, 565, 567, 569, 571, 573, 575, 577, 579, 581, 583, 585, 587, 589, 591, 593 및 595로 구성된 군으로부터 선택된 서열을 갖는 당단백질인, XDP 시스템.
- 제209항에 있어서, 상기 향성 인자는 수포성 구내염 바이러스(VSV-G)로부터의 당단백질 G인, XDP 시스템.
- 제203항 내지 제210항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 시스템.
- 제211항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 시스템.
- 제212항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제213항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 시스템.
- 제214항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 시스템.
- 제215항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 시스템.
- 제216항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열을 포함하는 CasX인, XDP 시스템.
- 제203항 내지 제217항 중 어느 한 항에 있어서, 상기 CasX는 서열번호: 130-166으로 구성된 서열의 군으로부터 선택된 하나 이상의 NLS를 추가로 포함하고, 여기서 NLS는 N-말단 및/또는 C-말단에 또는 그 근처에 위치되는, XDP 시스템.
- 제211항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산인, XDP 시스템.
- 제219항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 표적 핵산 서열에 상보성인, XDP 시스템.
- 제220항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 시스템.
- 제221항에 있어서, 상기 가이드 RNA의 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 시스템.
- 제220항 내지 제222항 중 어느 한 항에 있어서, 상기 가이드 RNA의 표적화 서열은 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 연속적인 뉴클레오티드로 구성되는, XDP 시스템.
- 제203항 내지 제223항 중 어느 한 항에 있어서,
(a) 상기 성분은 단일 핵산 상에 인코딩되거나;
(b) 상기 성분은 2개의 핵산 상에 인코딩되거나;
(c) 상기 성분은 3개의 핵산 상에 인코딩되거나;
(d) 상기 성분은 4개의 핵산 상에 인코딩되거나; 또는
(e) 상기 성분은 5개의 핵산 상에 인코딩되는, XDP 시스템. - 제224항에 있어서, 상기 핵산에 의해 인코딩되는 성분 중 하나 이상은 도 36-68 중 어느 하나에 따라 구성되는, XDP 시스템.
- 제224항 또는 제225항에 있어서, 상기 하나 이상의 성분은 표 5, 24, 27, 30, 및 33에 제시된 바와 같은 서열번호: 192, 193, 195, 196, 198-201, 782, 234-339, 880-933, 및 947-1000으로 구성된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열의 군으로부터 선택된 핵산에 의해 인코딩되는, XDP 시스템.
- 제224항 내지 제226항 중 어느 한 항에 있어서, 상기 성분은 하나 이상의 핵산이 진핵생물 숙주 세포 내로 도입되어 발현될 때 XDP 내로 자가-어셈블리될 수 있는, XDP 시스템.
- 제227항에 있어서, 상기 치료 페이로드는 XDP의 자가-어셈블리 시에 XDP 내에 캡슐화되는, XDP.
- 제228항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 시스템.
- 제227항에 있어서, 상기 향성 인자는 XDP의 자가-어셈블리 시에 XDP 표면 상에 합체되는, XDP.
- 제230항에 있어서, 상기 향성 인자는 표적 세포의 세포 표면과 우선적인 상호작용을 부여하고 표적 세포 내로 XDP의 진입을 용이하게 하는, XDP 시스템.
- 제1항 내지 제231항 중 어느 한 항에 있어서, 상기 gag 폴리단백질 및 치료 페이로드는 융합 단백질로서 발현되는, XDP 시스템.
- 제232항에 있어서, 상기 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하지 않는, XDP 시스템.
- 제232항에 있어서, 상기 융합 단백질은 gag 폴리단백질과 치료 페이로드 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
- 제232항 내지 제234항 중 어느 한 항에 있어서, 상기 융합 단백질은 gag 폴리단백질의 성분 사이에 프로테아제 절단 부위를 포함하는, XDP 시스템.
- 제234항 및/또는 제235항에 있어서, 상기 절단 부위는 Gag-Pol 폴리단백질의 프로테아제, gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제, 또는 비-레트로바이러스 이종성 프로테아제에 의해 절단될 수 있는, XDP 시스템.
- 제236항에 있어서, 상기 절단 부위는 gag-트랜스프레임 영역-pol 프로테아제 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
- 제236항에 있어서, 상기 절단 부위는 Gag-Pol 폴리단백질의 프로테아제에 의해 절단될 수 있는, XDP 시스템.
- 제236항에 있어서, 상기 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV), 포티바이러스 HC 프로테아제, 포티바이러스 P1 프로테아제, PreScission(HRV3C 프로테아제), b 바이러스 NIa 프로테아제, B 바이러스 RNA-2-인코딩된 프로테아제, 아프토바이러스 L 프로테아제, 엔테로바이러스 2A 프로테아제, 라이노바이러스 2A 프로테아제, 피코르나 3C 프로테아제, 코모바이러스 24K 프로테아제, 네포바이러스 24K 프로테아제, RTSV(라이스 텅그로 구형 바이러스) 3C-유사 프로테아제, 파스닙 황색 반점 바이러스 프로테아제, 3C-유사 프로테아제, 헤파린, 카텝신, 트롬빈, 인자 Xa, 메탈로프로테이나제 및 엔테로키나제로 구성된 군으로부터 선택되는, XDP 시스템.
- 제239항에 있어서, 상기 비-레트로바이러스 이종성 프로테아제는 PreScission(HRV3C 프로테아제)인, XDP 시스템.
- 제239항에 있어서, 상기 비-레트로바이러스 이종성 프로테아제는 담배 식각 바이러스 프로테아제(TEV)인, XDP 시스템.
- 제12항 내지 제13항, 제44항 내지 제47항, 제73항 내지 제76항, 제96항 내지 제99항, 제103항 내지 제106항, 제132항 내지 제135항, 제161항 내지 제164항, 제192항 내지 제195항 또는 제221항 내지 제224항 중 어느 한 항에 있어서, 상기 가이드 RNA는 하나 이상의 리보자임을 추가로 포함하는, XDP 시스템.
- 제242항에 있어서, 상기 하나 이상의 리보자임은 가이드 RNA의 말단에 독립적으로 융합되는, XDP 시스템.
- 제242항 또는 제243항에 있어서, 상기 하나 이상의 리보자임 중 적어도 하나는 간염 델타 바이러스(HDV) 리보자임, 헤머헤드 리보자임, 피스톨 리보자임, 해칫 리보자임, 또는 담배 링스팟 바이러스(TRSV) 리보자임인, XDP 시스템.
- 제12항 내지 제13항, 제44항 내지 제47항, 제73항 내지 제76항, 제96항 내지 제99항, 제103항 내지 제106항, 제132항 내지 제135항, 제161항 내지 제164항, 제192항 내지 제195항 또는 제221항 내지 제224항 중 어느 한 항에 있어서, 상기 가이드 RNA는 화학적으로 변형된, XDP 시스템.
- 제12항 내지 제13항, 제44항 내지 제47항, 제73항 내지 제76항, 제96항 내지 제99항, 제103항 내지 제106항, 제132항 내지 제135항, 제161항 내지 제164항, 제192항 내지 제195항 또는 제221항 내지 제224항 중 어느 한 항에 있어서, 상기 가이드 RNA는 Psi 패키징 요소, 키싱 고리_a, 키싱 고리_b1, 키싱 고리_b2, G 사중체 M3q, G 사중체 텔로미어 바스켓, 사르신-리신 고리 또는 가매듭으로 구성된 군으로부터 선택된 요소를 포함하고, 여기서 요소는 MS2, PP7, Q베타, U1A 및 파지 R-고리로 구성된 군에서 선택된 CasX 내로 합체된 단백질에 대해 친화성을 갖는, XDP 시스템.
- 제1항 내지 제246항 중 어느 한 항의 XDP 시스템을 포함하는 진핵 세포.
- 제247항에 있어서, 상기 세포는 패키징 세포인, 진핵 세포.
- 제247항 또는 제248항에 있어서, 상기 진핵세포는 HEK293 세포, Lenti-X 293T 세포, BHK 세포, HepG2, Saos-2, HuH7, NS0 세포, SP2/0 세포, YO 골수종 세포, A549 세포, P3X63 마우스 골수종 세포, PER 세포, PER.C6 세포, 하이브리도마 세포, VERO, NIH3T3 세포, COS, WI38, MRC5, A549, HeLa 세포, CHO 세포 및 HT1080 세포로 구성된 군으로부터 선택되는, 진핵 세포.
- 제248항 또는 제249항에 있어서, 상기 패키징 세포는 세포 표면 마커의 발현을 감소시키는 하나 이상의 돌연변이를 포함하는, 진핵 세포.
- 제247항 내지 제250항 중 어느 한 항에 있어서, XDP 시스템을 인코딩하는 핵산의 전부 또는 일부는 진핵 세포의 게놈 내로 합체되는, 진핵 세포.
- 치료 페이로드를 포함하는 XDP를 제조하는 방법으로서, 상기 방법은:
(a) XDP가 생성되도록 하는 조건 하에서 제248-251 중 어느 하나의 패키징 세포를 번식시키는 단계; 및
(b) 패키징 세포에 의해 생성된 XDP를 수확하는 단계를 포함하는, 방법. - 제252항의 방법에 의해 생성된 XDP.
- 제253항에 있어서, CasX 및 가이드 RNA의 RNP의 치료 페이로드 및, 선택적으로, 공여자 주형을 포함하는, XDP.
- 세포에서 표적 핵산 서열을 변형시키는 방법의 방법으로서, 상기 방법은 세포를 제254항의 XDP와 접촉시키는 것을 포함하며, 여기서 상기 접촉은 RNP 및 선택적으로 공여자 주형 핵산 서열을 세포 내로 도입하는 것을 포함하고, 여기서 가이드 RNA에 의해 표적화된 표적 핵산은 CasX에 의해 변형되는, 방법.
- 제255항에 있어서, 상기 변형은 표적 핵산 서열에 하나 이상의 단일-가닥 파손을 도입하는 것을 포함하는, 방법.
- 제255항에 있어서, 상기 변형은 표적 핵산 서열에 하나 이상의 이중-가닥 파손을 도입하는 것을 포함하는, 방법.
- 제255항 내지 제257항 중 어느 한 항에 있어서, 상기 변형은 표적 핵산 서열 내로 공여자 주형의 삽입을 포함하는, 방법.
- 제255항 내지 제258항 중 어느 한 항에 있어서, 상기 세포는 시험관내 또는 생체외에서 변형되는, 방법.
- 제255항 내지 제258항 중 어느 한 항에 있어서, 상기 세포는 생체내에서 변형되는, 방법.
- 제260항에 있어서, 상기 XDP는 대상체에게 투여되는, 방법.
- 제261항에 있어서, 상기 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
- 제261항 또는 제262항에 있어서, 상기 XDP는 피하, 피내, 신경내, 결절내, 골수내, 근육내, 정맥내, 뇌실내, 수조내, 척추강내, 두개내, 요추내, 기관내, 골내, 흡입, 반대측 선조체, 안내, 유리체내, 림프내, 복강내 경로 및 망막하 경로로 구성된 군으로부터 선택되는 투여 경로에 의해 투여되는, 방법.
- 제261항 내지 제263항 중 어느 한 항에 있어서, 상기 XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
- 제264항에 있어서, 상기 XDP는 적어도 약 1 x 105 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg의 용량으로 투여되는, 방법.
- 제261항 내지 제265항 중 어느 한 항에 있어서, 상기 XDP는 치료적으로 유효한 용량의 XDP를 사용하여 1회 이상의 연속적 용량을 포함하는 치료 요법에 따라 대상체에게 투여되는, 방법.
- 제266항에 있어서, 상기 치료적으로 유효한 용량은 적어도 2주, 또는 적어도 1개월, 또는 적어도 2개월, 또는 적어도 3개월, 또는 적어도 4개월, 또는 적어도 5개월, 또는 적어도 6개월, 또는 1년에 1회, 또는 2년 또는 3년마다의 기간에 걸쳐 2회 이상의 용량으로서 대상체에게 투여되는, 방법.
- RNP가 세포에 들어가도록 세포를 제253항 또는 제254항의 XDP와 접촉시키는 것을 포함하는, 표적 핵산을 갖는 세포 내로 CasX 및 gNA RNP를 도입하는 방법.
- 제268항에 있어서, 상기 RNP는 표적 핵산에 결합하는, 방법.
- 제269항에 있어서, 상기 표적 핵산은 CasX에 의해 절단되는, 방법.
- 제268항 내지 제270항 중 어느 한 항에 있어서, 상기 세포는 시험관내에서 변형되는, 방법.
- 제268항 내지 제270항 중 어느 한 항에 있어서, 상기 세포는 생체내에서 변형되는, 방법.
- 제272항에 있어서, 상기 XDP는 대상체에게 투여되는, 방법.
- 제273항에 있어서, 상기 대상체는 마우스, 랫트, 돼지, 비-인간 영장류 및 인간으로 구성된 군으로부터 선택되는 대상체인, 방법.
- 제272항 내지 제274항 중 어느 한 항에 있어서, 상기 XDP는 치료적으로 유효한 용량을 사용하여 대상체에게 투여되는, 방법.
- 제275항에 있어서, 상기 XDP는 적어도 약 1 x 105 입자/kg, 또는 적어도 약 1 x 106 입자/kg, 또는 적어도 약 1 x 107 입자/kg, 또는 적어도 약 1 x 108 입자/kg, 또는 적어도 약 1 x 109 입자/kg, 또는 적어도 약 1 x 1010 입자/kg, 또는 적어도 약 1 x 1011 입자/kg, 또는 적어도 약 1 x 1012 입자/kg, 또는 적어도 약 1 x 1013 입자/kg, 또는 적어도 약 1 x 1014 입자/kg, 또는 적어도 약 1 x 1015 입자/kg, 또는 적어도 약 1 x 1016 입자/kg의 용량으로 투여되는, 방법.
- 다음을 포함하는 XDP 입자:
(a) 레트로바이러스 기질(MA) 폴리펩티드;
(b) 상기 XDP 내에 캡슐화된 치료 페이로드; 및
(c) 상기 XDP 표면 상에 합체된 향성 인자. - 제277항에 있어서,
(a) 캡시드 폴리펩티드(CA);
(b) 뉴클레오캡시드 폴리펩티드(NC);
(c) P2A 펩티드, P2B 펩티드;
(d) P10 펩티드;
(e) p12 펩티드
(f) PP21/24 펩티드;
(g) P12/P3/P8 펩티드;
(h) P20 펩티드;
(i) p1 펩티드; 및
(j) p6 펩티드로부터 선택된 하나 이상의 레트로바이러스 성분을 추가로 포함하는, XDP 입자. - 제277항 또는 제278항에 있어서, 상기 향성 인자는 당단백질, 항체 단편, 수용체, 및 표적 세포 마커에 대한 리간드로 구성된 군으로부터 선택되는, XDP 입자.
- 제279항에 있어서, 상기 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 갖는 당단백질인, XDP 입자.
- 제279항에 있어서, 상기 향성 인자는 서열번호: 438, 440, 442, 444, 446, 448, 450, 452, 454, 456, 458, 460, 462, 464, 466, 468, 470, 472, 474, 476, 478, 480, 482, 484, 486, 488, 490, 492, 494, 496, 498, 500, 502, 504, 506, 508, 510, 512, 514, 516, 518, 520, 522, 524, 526, 528, 530, 532, 534, 536, 538, 540, 542, 544, 546, 548, 550, 552, 554, 556, 558, 560, 562, 564, 566, 568, 570, 572, 574, 576, 578, 580, 582, 584, 586, 588, 590, 592, 594 및 596으로 구성된 군으로부터 선택된 인코딩 서열을 갖는 당단백질인, XDP 입자.
- 제277항 내지 제281항 중 어느 한 항에 있어서, 상기 치료 페이로드는 단백질, 핵산을 포함하거나, 또는 단백질 및 핵산 둘 모두를 포함하는, XDP 입자.
- 제282항에 있어서, 상기 단백질 페이로드는 사이토카인, 인터루킨, 효소, 수용체, 마이크로단백질, 호르몬, 에리트로포이에틴, RNAse, DNAse, 혈액 응고 인자, 항응고제, 뼈 형태형성 단백질, 조작된 단백질 스캐폴드, 혈전용해 단백질, CRISPR 단백질 및 항암 양식으로 구성된 군으로부터 선택되는, XDP 입자.
- 제283항에 있어서, 상기 CRISPR 단백질은 클래스 1 또는 클래스 2 CRISPR 단백질인, XDP 입자.
- 제284항에 있어서, 상기 CRISPR 단백질은 유형 II, 유형 V, 또는 유형 VI 단백질로 구성된 군으로부터 선택된 클래스 2 CRISPR 단백질인, XDP 입자.
- 제285항에 있어서, 상기 CRISPR 단백질은 Cas12a, Cas12b, Cas12c, Cas12d(CasY), Cas12j 및 CasX로 구성된 군으로부터 선택된 유형 V 단백질인, XDP 입자.
- 제286항에 있어서, 상기 CRISPR 단백질은 서열번호: 21-233, 343-345, 350-353, 355-367 또는 388-397의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는 CasX인, XDP 입자.
- 제282항에 있어서, 상기 치료 페이로드는 단일-가닥 안티센스 올리고뉴클레오티드(ASO), 이중-가닥 RNA 간섭(RNAi) 분자, DNA 압타머, 및 CRISPR 가이드 핵산으로 구성된 군으로부터 선택된 핵산을 포함하는, XDP 입자.
- 제288항에 있어서, 상기 CRISPR 가이드 핵산은 스캐폴드 서열 및 표적화 서열을 포함하는 단일-분자 가이드 RNA이고, 여기서 표적화 서열은 14 내지 30개의 뉴클레오티드를 포함하고 표적 핵산 서열에 상보적인, XDP 입자.
- 제289항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열, 또는 이들에 적어도 약 85%, 적어도 약 90%, 적어도 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98%, 또는 적어도 약 99% 서열 동일성을 갖는 서열을 포함하는, XDP 입자.
- 제290항에 있어서, 상기 스캐폴드 서열은 서열번호: 597-781의 서열을 포함하는, XDP 입자.
- 제286항 내지 제291항 중 어느 한 항에 있어서, 상기 치료 페이로드는 리보핵단백질 복합체(RNP) 및, 선택적으로, 공여자 주형으로서 복합체화된 CasX 및 가이드 RNA를 포함하는, XDP 입자.
- 제277항 내지 제292항 중 어느 한 항에 있어서, 상기 레트로바이러스 성분은 오르소레트로바이러스아과 바이러스 또는 스푸마레트로바이러스아과 바이러스로부터 유래되는, XDP 입자.
- 제293항에 있어서, 상기 오르소레트로바이러스아과 바이러스는 알파레트로바이러스, 베타레트로바이러스, 델타레트로바이러스, 엡실론레트로바이러스, 감마레트로바이러스, 및 렌티바이러스로 구성된 군으로부터 선택되는, XDP 입자.
- 제293항에 있어서, 상기 스푸마레트로바이러스아과 바이러스는 보비스푸마바이러스, 에퀴스푸마바이러스, 펠리스푸마바이러스, 프로시미스푸마바이러스, 시미스푸마바이러스 및 스푸마바이러스로 구성된 군으로부터 선택되는, XDP 입자.
- 질환을 갖는 대상체의 치료를 위한 약제로서 사용하기 위한, 제1항 내지 제295항 중 어느 한 항의 XDP 입자, 또는 XDP 시스템.
Applications Claiming Priority (11)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201962944982P | 2019-12-06 | 2019-12-06 | |
| US62/944,982 | 2019-12-06 | ||
| US202062968915P | 2020-01-31 | 2020-01-31 | |
| US62/968,915 | 2020-01-31 | ||
| US202062983460P | 2020-02-28 | 2020-02-28 | |
| US62/983,460 | 2020-02-28 | ||
| US202063035576P | 2020-06-05 | 2020-06-05 | |
| US63/035,576 | 2020-06-05 | ||
| US202063120864P | 2020-12-03 | 2020-12-03 | |
| US63/120,864 | 2020-12-03 | ||
| PCT/US2020/063488 WO2021113772A1 (en) | 2019-12-06 | 2020-12-04 | Particle delivery systems |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| KR20220113442A true KR20220113442A (ko) | 2022-08-12 |
Family
ID=74046189
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| KR1020227022874A Withdrawn KR20220113442A (ko) | 2019-12-06 | 2020-12-04 | 입자 전달 시스템 |
Country Status (8)
| Country | Link |
|---|---|
| EP (1) | EP4069716A1 (ko) |
| JP (1) | JP2023504536A (ko) |
| KR (1) | KR20220113442A (ko) |
| CN (1) | CN115175921A (ko) |
| AU (1) | AU2020398658A1 (ko) |
| CA (1) | CA3159320A1 (ko) |
| IL (1) | IL293591A (ko) |
| WO (1) | WO2021113772A1 (ko) |
Families Citing this family (24)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2020154500A1 (en) | 2019-01-23 | 2020-07-30 | The Broad Institute, Inc. | Supernegatively charged proteins and uses thereof |
| JP7744011B2 (ja) | 2019-06-07 | 2025-09-25 | スクライブ・セラピューティクス・インコーポレイテッド | 操作されたcasxシステム |
| JP2022536364A (ja) | 2019-06-13 | 2022-08-15 | ザ ジェネラル ホスピタル コーポレイション | 操作されたヒト内在性ウイルス様粒子および細胞への送達のためのその使用方法 |
| AU2021310950A1 (en) | 2020-07-24 | 2023-02-16 | President And Fellows Of Harvard College | Enhanced virus-like particles and methods of use thereof for delivery to cells |
| JP2023552374A (ja) | 2020-12-03 | 2023-12-15 | スクライブ・セラピューティクス・インコーポレイテッド | 操作されたクラス2 v型crisprシステム |
| WO2022120089A1 (en) | 2020-12-03 | 2022-06-09 | Scribe Therapeutics Inc. | Compositions and methods for the targeting of ptbp1 |
| EP4351660A2 (en) | 2021-06-09 | 2024-04-17 | Scribe Therapeutics Inc. | Particle delivery systems |
| WO2023049742A2 (en) | 2021-09-21 | 2023-03-30 | Scribe Therapeutics Inc. | Engineered casx repressor systems |
| US20250290093A1 (en) * | 2022-04-29 | 2025-09-18 | Cz Biohub Sf, Llc | High capacity lentiviral vectors |
| JP2025520127A (ja) | 2022-06-02 | 2025-07-01 | スクライブ・セラピューティクス・インコーポレイテッド | 操作されたクラス2タイプv crispr系 |
| WO2023235888A2 (en) | 2022-06-03 | 2023-12-07 | Scribe Therapeutics Inc. | COMPOSITIONS AND METHODS FOR CpG DEPLETION |
| WO2023240027A1 (en) | 2022-06-07 | 2023-12-14 | Scribe Therapeutics Inc. | Particle delivery systems |
| WO2023240074A1 (en) | 2022-06-07 | 2023-12-14 | Scribe Therapeutics Inc. | Compositions and methods for the targeting of pcsk9 |
| KR20250035055A (ko) | 2022-06-07 | 2025-03-11 | 스크라이브 테라퓨틱스 인크. | Pcsk9의 표적화를 위한 조성물 및 방법 |
| WO2023240162A1 (en) | 2022-06-08 | 2023-12-14 | Scribe Therapeutics Inc. | Aav vectors for gene editing |
| WO2023240157A2 (en) | 2022-06-08 | 2023-12-14 | Scribe Therapeutics Inc. | Compositions and methods for the targeting of dmd |
| WO2024129976A2 (en) * | 2022-12-14 | 2024-06-20 | Scribe Therapeutics Inc. | Particle delivery systems |
| AU2024248139A1 (en) | 2023-03-29 | 2025-09-25 | Scribe Therapeutics Inc. | Compositions and methods for the targeting of pcsk9 |
| WO2024206620A1 (en) | 2023-03-29 | 2024-10-03 | Scribe Therapeutics Inc. | Messenger rna encoding casx |
| WO2024206676A1 (en) | 2023-03-29 | 2024-10-03 | Scribe Therapeutics Inc. | Compositions and methods for the targeting of lpa |
| WO2024206565A1 (en) | 2023-03-29 | 2024-10-03 | Scribe Therapeutics Inc. | Repressor fusion protein systems |
| WO2024254518A2 (en) * | 2023-06-07 | 2024-12-12 | Nvelop Therapeutics, Inc. | Compositions of lipid delivery particles and method of use thereof |
| WO2025072293A1 (en) | 2023-09-27 | 2025-04-03 | Scribe Therapeutics Inc. | Optimized mrnas encoding casx proteins |
| CN117344061B (zh) * | 2023-12-05 | 2024-02-27 | 云南省细胞质量检测评价中心有限公司 | 一种同时检测五种人源病毒ebv、hbv、hcv、hiv、hpv的方法、试剂盒、引物和探针及其应用 |
Family Cites Families (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5593972A (en) | 1993-01-26 | 1997-01-14 | The Wistar Institute | Genetic immunization |
| EP0681483B1 (en) | 1993-01-26 | 2005-08-24 | The Trustees of the University of Pennsylvania (a corporation of Pennsylvania) | Compositions and methods for delivery of genetic material |
| US5962428A (en) | 1995-03-30 | 1999-10-05 | Apollon, Inc. | Compositions and methods for delivery of genetic material |
| WO2010075303A1 (en) | 2008-12-23 | 2010-07-01 | The United States Of America, As Represented By The Secretary, Department Of Health And Human Services | Splicing factors with a puf protein rna-binding domain and a splicing effector domain and uses of same |
| WO2012068627A1 (en) | 2010-11-24 | 2012-05-31 | The University Of Western Australia | Peptides for the specific binding of rna targets |
| US10968253B2 (en) * | 2015-10-20 | 2021-04-06 | Institut National De La Sante Et De La Recherche Medicale (Inserm) | Methods and products for genetic engineering |
| WO2018064371A1 (en) * | 2016-09-30 | 2018-04-05 | The Regents Of The University Of California | Rna-guided nucleic acid modifying enzymes and methods of use thereof |
| KR20200003160A (ko) * | 2017-05-03 | 2020-01-08 | 바이오마린 파머수티컬 인크. | 조혈모세포의 형질도입을 위한 개선된 렌티바이러스 |
-
2020
- 2020-12-04 EP EP20829466.0A patent/EP4069716A1/en active Pending
- 2020-12-04 JP JP2022533213A patent/JP2023504536A/ja active Pending
- 2020-12-04 IL IL293591A patent/IL293591A/en unknown
- 2020-12-04 WO PCT/US2020/063488 patent/WO2021113772A1/en not_active Ceased
- 2020-12-04 CA CA3159320A patent/CA3159320A1/en active Pending
- 2020-12-04 CN CN202080094851.0A patent/CN115175921A/zh active Pending
- 2020-12-04 KR KR1020227022874A patent/KR20220113442A/ko not_active Withdrawn
- 2020-12-04 AU AU2020398658A patent/AU2020398658A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| EP4069716A1 (en) | 2022-10-12 |
| JP2023504536A (ja) | 2023-02-03 |
| WO2021113772A1 (en) | 2021-06-10 |
| CN115175921A (zh) | 2022-10-11 |
| AU2020398658A1 (en) | 2022-07-07 |
| CA3159320A1 (en) | 2021-06-10 |
| IL293591A (en) | 2022-08-01 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR20220113442A (ko) | 입자 전달 시스템 | |
| AU2022200903B2 (en) | Engineered Cascade components and Cascade complexes | |
| AU2018240515B2 (en) | Nucleic acids encoding CRISPR-associated proteins and uses thereof | |
| AU2018330197B2 (en) | Nuclease systems for genetic engineering | |
| AU2019204982B2 (en) | Recombinant HCMV and RhCMV Vectors and Uses Thereof | |
| AU2018203835B2 (en) | Recombinant dna constructs and methods for modulating expression of a target gene | |
| AU2023214237A1 (en) | Modified polynucleotides for the production of biologics and proteins associated with human disease | |
| KR20230111189A (ko) | 재프로그램 가능한 iscb 뉴클레아제 및 이의 용도 | |
| KR20230057487A (ko) | 게놈 조정을 위한 방법 및 조성물 | |
| KR20210149060A (ko) | Tn7-유사 트랜스포존을 사용한 rna-유도된 dna 통합 | |
| KR20210138603A (ko) | 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기를 갖는 변형된 면역 세포 | |
| KR20220044811A (ko) | Crispr/cas13을 사용하는 표적화된 트랜스-이어맞추기 | |
| AU2018201717A1 (en) | Optimal maize loci | |
| AU2018200955A1 (en) | Optimal maize loci | |
| KR102205348B1 (ko) | 외인성 항원을 포함하는 인간 시토메갈로바이러스 | |
| KR20220038362A (ko) | 재조합 ad35 벡터 및 관련 유전자 요법 개선 | |
| KR20210082205A (ko) | 레트로바이러스 인테그라제-Cas9 융합 단백질을 이용한 유도된 비상동 DNA 삽입에 의한 게놈 편집 | |
| KR20230129230A (ko) | Bcl11a의 표적화를 위한 조성물 및 방법 | |
| KR20240029020A (ko) | Dna 변형을 위한 crispr-트랜스포손 시스템 | |
| CN117157109A (zh) | 腺病毒基因疗法载体 | |
| KR20230173074A (ko) | 향상된 이종이식편 생존 및 관용을 위한 하나 이상의 변형된 유전자를 갖는 세포, 조직, 기관, 및 동물 | |
| KR20230031929A (ko) | 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도 | |
| KR20210053923A (ko) | 항종양 면역 반응을 자극하는 키메라 종양 용해성 허피스바이러스 | |
| KR20240000580A (ko) | 레트로바이러스 인테그라제-Cas 융합 단백질을 이용한 직접 비상동 DNA 삽입에 의한 게놈 편집 및 치료 방법 | |
| KR20230134487A (ko) | Rna 구조체 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PA0105 | International application |
St.27 status event code: A-0-1-A10-A15-nap-PA0105 |
|
| PG1501 | Laying open of application |
St.27 status event code: A-1-1-Q10-Q12-nap-PG1501 |
|
| PC1203 | Withdrawal of no request for examination |
St.27 status event code: N-1-6-B10-B12-nap-PC1203 |