KR20010022917A - Methods and compositions for detection or quantification of nucleic acid species - Google Patents
Methods and compositions for detection or quantification of nucleic acid species Download PDFInfo
- Publication number
- KR20010022917A KR20010022917A KR1020007001522A KR20007001522A KR20010022917A KR 20010022917 A KR20010022917 A KR 20010022917A KR 1020007001522 A KR1020007001522 A KR 1020007001522A KR 20007001522 A KR20007001522 A KR 20007001522A KR 20010022917 A KR20010022917 A KR 20010022917A
- Authority
- KR
- South Korea
- Prior art keywords
- probe
- probes
- nucleic acid
- sequence
- target nucleic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
본 발명은 기질에 고정된 프로브 및 라벨된 다수의 프로브 배열을 이용하여, 표적 핵산 종을 감지하는 방법을 제공한다. 또한, 본 발명은 별개 입자에 부착된 올리고뉴클레오티드 프로브에 관계하는데, 이때, 입자는 물리적 성질에 기초하여, 여러 가지 세트로 나눌 수 있다. 각 세트의 별개 입자에는 상이한 프로브가 부착되오, 각 프로브의 확인은 별개 입자의 물리적인 성질에 기초하여 실시된다. 본 발명은 또한, 상보적인 폴리뉴클레오티드 가닥의 결합을 불안정화(결합 에너지를 감소)시키는 또는 상보적인 폴리뉴클레오티드 가닥간의 결합 안정성을 증가(결합 에너지 증가)시키는 물질을 이용하는 방법에 관계한다. 도면은 프로브 배열을 만드는데 이용되는 장치를 설명하는 것이다.The present invention provides a method for detecting a target nucleic acid species using a probe immobilized on a substrate and a plurality of labeled probe arrays. The invention also relates to oligonucleotide probes attached to separate particles, wherein the particles can be divided into various sets based on physical properties. Different probes are attached to each set of separate particles, and identification of each probe is performed based on the physical properties of the separate particles. The present invention also relates to methods of using materials which destabilize the binding of complementary polynucleotide strands (reduce binding energy) or increase the binding stability between complementary polynucleotide strands (increase binding energy). The figure illustrates the apparatus used to make the probe array.
Description
핵산 샘플에서 4개 뉴클레오티드의 순서를 결정하는 속도가 분자생물학, 의학, 생명공학 등의 추가 발전에 주요 장애물이 된다. 겔에서 핵산 분자를 분리하는 것과 연관된 핵산의 순서를 정하는 방법이 1978년부터 이용되어왔다. 핵산의 순서를 결정하는 다른 증명된 방법은 하이브리드(SBH)에 의한 것이다.The speed of ordering four nucleotides in nucleic acid samples is a major obstacle to further developments in molecular biology, medicine, and biotechnology. A method of sequencing nucleic acids associated with separating nucleic acid molecules from a gel has been used since 1978. Another proven method of determining the order of nucleic acids is by hybrid (SBH).
뉴클레오티드의 순서를 결정하는 방법(가령, 샘플에 있는 A, G, C, T의 순서를 결정하는 등의)으로써, 특정한 뉴클레오티드에서 분해하거나 복제되는 가닥의 디데옥시 사슬 종료 등의 방법으로 무작위로 종료된 다른 것으로 라벨된 핵산 단편 혼합물을 만들어서 실행하는 것이 통상적인 방법이다. 그 다음 1 내지 500bp 범위의 생성된 핵산 단편을 겔상에서 분리하여, 밴드 사다리를 만드는데, 이때 인접한 샘플은 한 대 뉴클레오티드 차이가 난다.A method of determining the order of nucleotides (e.g., determining the order of A, G, C, T, etc. in a sample), such as randomly terminating a dideoxy chain termination of a strand that is degraded or replicated at a particular nucleotide. It is common practice to make and carry out nucleic acid fragment mixtures labeled with one another. The resulting nucleic acid fragments in the range of 1 to 500 bp are then separated on the gel to create a band ladder, where adjacent samples differ by one nucleotide.
SBH 배열 방법은 분리할 때 단일 염기 해리, 핵산 분해, 합성 또는 영상을 요구하지는 않는다. 짧은 올리고뉴클레오티드 K 염기의 미스메취(mismatch)로 식별하는 하이브리드 반응을 이용하여 표적이 되는 핵산의 구성인 K-mer 올리고뉴클레오티드의 리스트를 결정할 수 있다. 표적이 되는 핵산의 서열은 독특하게 겹쳐지는 올리고뉴클레오티드를 이용하여 조립할 수 있다.The SBH alignment method does not require single base dissociation, nucleic acid degradation, synthesis or imaging when isolated. Hybrid reactions, which are identified by mismatches of short oligonucleotide K bases, can be used to determine the list of K-mer oligonucleotides that are the makeup of the target nucleic acid. The sequence of the target nucleic acid can be assembled using uniquely overlapping oligonucleotides.
하이브리드 반응을 이용하여 서열을 얻는 방법에는 여러 가지가 있다. SBH Format I이라고 불리는 공정에서는 핵산 샘플을 배열하고, 라벨된 프로브는 샘플과 하이브리드한다. 몇 가지 프로브를 나란하게 배열하기 위해 동일한 세트의 핵산을 가지는 복제 막을 이용한다. 나일론 막 또는 다른 적절한 서포트에 핵산 샘플을 배열하고 하이브리드한다. 각 막 배열은 여러 번 사용할 수 있다. Format 1은 다수의 샘플을 배취상태에서 처리할 경우에 효과가 있다.There are several ways to obtain sequences using hybrid reactions. In a process called SBH Format I, nucleic acid samples are arranged and labeled probes hybridize with the sample. Replication membranes with the same set of nucleic acids are used to arrange several probes side by side. The nucleic acid sample is arranged and hybridized to a nylon membrane or other suitable support. Each membrane array can be used multiple times. Format 1 is effective when processing multiple samples in batches.
SBH Format 2의 경우에는, 프로브는 기질 상에 각 서열에 상응하는 위치에 배열하고, 라벨된 핵산 샘플 단편은 배열된 프로브에 하이브리드시킨다. 이와 같은 경우에, 배열된 모든 염기와 동시에 하이브리드 반응을 하여 단편에 대한 서열 정보를 얻을 수 있다. 다른 핵산 단편을 서열화하기 위해서, 동일한 올리고뉴클레오티드 배열을 다시 이용할 수 있다. 스팟팅(spotting) 또는 in situ 프로브 합성으로 배열을 만든다.In the case of SBH Format 2, the probes are arranged at positions corresponding to each sequence on the substrate, and the labeled nucleic acid sample fragments are hybridized to the arrayed probes. In such a case, the sequence information for the fragment can be obtained by performing a hybrid reaction simultaneously with all the arranged bases. To sequence other nucleic acid fragments, the same oligonucleotide sequence can be used again. Arrays are made by spotting or in situ probe synthesis.
Format 3 SBH의 경우에, 두 세트의 프로브를 이용한다. 한 구체예에서, 알려진 위치를 가지는 프로브 배열형태를 이용하고, 다른 경우에는 라벨된 세트는 여러 웰 플레이트에 보관한다. 이 경우에 표적이 되는 핵산은 라벨할 필요가 없다. 표적이 되는 핵산에서 한 개의 부착된 프로브와 한 개 라벨된 프로브가 모두 하이브리드되는 경우에, 이들은 공유결합에 의해 결찰되어, 결찰된 프로브 길이의 합과 동일한 감지된 서열을 만든다. 이 공정은 더 긴 핵산 단편을 서열화할 수 있는데, 가령 더 작은 단편에서 핵산 서브클로닝없이 완전한 박테리아 게놈등을 서열화할 수 있다.In the case of Format 3 SBH, two sets of probes are used. In one embodiment, probe configurations having known positions are used, in other cases labeled sets are stored in several well plates. In this case, the target nucleic acid need not be labeled. If one attached probe and one labeled probe are both hybridized in the target nucleic acid, they are ligated by covalent bonds, creating a sensed sequence equal to the sum of the ligated probe lengths. This process can sequence longer nucleic acid fragments, such as the complete bacterial genome, etc., without nucleic acid subcloning in smaller fragments.
본 발명에서는 한 가지 이상의 핵산 샘플을 효과적으로 확인하고, 서열화하는데 SBH를 이용한다. 이과정은 핵산 진단, 변론 및 유전자 지도 작성 등의 여러 분야에 이용된다. 또한 이를 이용하여, 유전자 질병 또는 다른 특징에 원인이 되는 돌연변이를 확인하여, 생물학적 다양성을 평가하고, 핵산 서열에 따른 많은 다양한 형태의 데이터를 만들 수 있다.In the present invention, SBH is used to effectively identify and sequence one or more nucleic acid samples. This process is used in many fields, including nucleic acid diagnostics, arguments, and genetic mapping. It can also be used to identify mutations that are responsible for genetic disease or other features, to assess biological diversity, and to produce many different forms of data depending on nucleic acid sequences.
발명의 요약Summary of the Invention
본 발명은 표적이 되는 핵산 종을 감지하는 방법을 제공하는데, 이 방법은 기질에 고정된 프로브 배열 및 라벨된 프로브를 제공하는데, 이때 각 라벨된 프로브는 표적이 되는 핵산의 제 1 위치에 상응하는 제 1 핵산을 가지도록 선택되고, 기질에 고정된 적어도 한 가지 프로브의 핵산 서열은 표적의 핵산 서열의 제 2 부분에 상보적이고, 제 2 부분은 제 1 부분에 인접하고; 상보적인 서열에 프로브 서열이 하이브리드할 수 있는 조건하에 배열에 표적이 되는 핵산을 제공하고;The present invention provides a method for detecting a target nucleic acid species, which method provides a probe array immobilized on a substrate and a labeled probe, wherein each labeled probe corresponds to a first position of the target nucleic acid. The nucleic acid sequence of at least one probe selected to have a first nucleic acid and immobilized on a substrate is complementary to a second portion of the nucleic acid sequence of the target, and the second portion is adjacent to the first portion; Providing a nucleic acid targeted to the array under conditions such that the probe sequence can hybridize to the complementary sequence;
배열에 라벨된 프로브를 도입하여;Introducing a labeled probe into the array;
기질에 고정된 프로브를 표적이 되는 핵산에 하이브리드시키고;Hybridizing the probe fixed to the substrate to the target nucleic acid;
배열에서 인접하게 하이브리드된 프로브에 라벨된 프로브를 고정시키고; 그리고Immobilizing labeled probes to adjacent hybridized probes in an array; And
배열에서 프로브에 고정된 라벨된 프로브를 감지하는 것으로 구성된다. 본 발명의 적절한 방법에 따르면, 기질에 고정된 프로브 배열은 완전한 프로브 세트로 구성된다. 기질에 고정된 프로브중 적어도 2개는 표적이 되는 핵산 서열에 겹쳐지는 서열을 가지고, 좀더 적절하게는 라벨된 프로브의 적어도 두 개는 표적이 되는 핵산 서열의 겹쳐지는 서열이 된다. 또한, 본 발명의 또 다른 특징에 따르면, 공지의 서열을 가지는 표적이 되는 핵산을 감지하는 방법을 제공하는데, 이 방법은 다음과 같은 단계로 구성된다; 하이브리드를 할 수 있는 조건하에 고형 기질에 부착된 고정된 올리고뉴클레오티드 프로브 세트를 핵산 샘플과 접촉시키고 이때, 고정된 프로브는 표적이 되는 핵산 서열의 상이한 부분과 특정하게 하이브리드할 수 있는 능력이 있고; 하이브리드 반응을 할 수 있는 조건하에 용액에 있는 라벨된 올리고뉴클레오티드 프로브 세트와 표적 핵산을 접촉시키는데, 이때 라벨된 프로브는 고정된 프로브에 인접한 표적 핵산 서열의 다른 부분과 특이적으로 하이브리드할 수 있고; 표적 서열상에서 고정된 프로브에 바로 인접한 라벨된 프로브에 고정된 프로브를 공유결합에 의해 결찰시키고(가령, 리게이즈를 이용); 임의 결찰안된 라벨된 프로브는 제거하고; 고정된 프로브에 부착된 라벨된 프로브가 존재하는지를 감지하는 단계로 구성된다. 본 발명은 또한 세포형, 조직 또는 조직 혼합물에서 부분적으로 또는 완전하게 서열화된 유전자 세트 구성 요소의 발현을 결정하는 방법을 제공하는데, 이때 이 방법은 서열화된 유전자에 특이적인 고정된 라벨된 프로브 쌍을 제공하고; 한 개 이상의 고정된 프로브에 배열에 라벨안된 핵산 샘플 및 이에 상응하는 라벨된 프로브를 하이브리드시키고; 하이브리드된 라벨 프로브와 고정된 프로브산에 공유결합을 형성시키고; 그리고, 배열에서 미리 특정한 위치에 결합된 라벨된 프로브를 감지하여 서열화된 유전자가 존재하는 지를 결정하는 단계로 구성된다. 본 발명의 적절한 구체예에서, 표적이 되는 핵산은 감염성 물질의 존재를 확인할 수 있다.Consisting of sensing labeled probes fixed to the probes in an array. According to a suitable method of the invention, the probe arrangement immobilized on the substrate consists of a complete set of probes. At least two of the probes immobilized on the substrate have a sequence overlapping the target nucleic acid sequence, and more suitably, at least two of the labeled probes are overlapping sequences of the target nucleic acid sequence. In addition, according to another aspect of the present invention, there is provided a method for detecting a target nucleic acid having a known sequence, the method comprising the following steps; A set of immobilized oligonucleotide probes attached to a solid substrate under conditions capable of hybridization is contacted with a nucleic acid sample, wherein the immobilized probe has the ability to specifically hybridize with different portions of the target nucleic acid sequence; Contacting the target nucleic acid with a set of labeled oligonucleotide probes in solution under conditions capable of a hybrid reaction, wherein the labeled probe can specifically hybridize with another portion of the target nucleic acid sequence adjacent to the immobilized probe; The probe immobilized to the labeled probe immediately adjacent the immobilized probe on the target sequence is covalently ligated (eg, using ligase); Remove any ligated labeled probes; Detecting whether there is a labeled probe attached to the fixed probe. The present invention also provides a method for determining the expression of partially or fully sequenced gene set components in a cell type, tissue or tissue mixture, wherein the method is directed to immobilized labeled probe pairs specific for the sequenced gene. Providing; Hybridizing the unlabeled nucleic acid sample and its corresponding labeled probe to one or more immobilized probes; Forming a covalent bond to the hybridized label probe and the immobilized probe acid; And detecting the labeled probe previously bound to a specific position in the array to determine if the sequenced gene is present. In a suitable embodiment of the invention, the target nucleic acid can confirm the presence of an infectious agent.
또한, 본 발명은 올리고뉴클레오티드 프로브 배열을 제공하는데, 이는 나일론 막; 나일론 막에 배열된 다수의 올리고뉴클레오티드 프로브 하위 배열; 이때 하위배열은 다수의 개별 스팟으로 구성되고; 각 스팟은 동일한 서열을 가지는 다수의 올리고뉴클레오티드 프로브로 구성되고; 나일론 막상에는 다수의 소수성 장벽이 하위배열간에 위치하여, 다수의 소수성 장벽으로 인하여 인접한 하위 배열이 섞이는 것을 방지한다.The present invention also provides an oligonucleotide probe arrangement, which comprises a nylon membrane; Multiple oligonucleotide probe subarrays arranged on nylon membranes; Wherein the subarray consists of a number of individual spots; Each spot consists of a plurality of oligonucleotide probes having the same sequence; On the nylon membrane, a plurality of hydrophobic barriers are placed between subarrays, preventing the mixing of adjacent subarrays due to the multiple hydrophobic barriers.
또한, 본 발명은 반복되는 서열을 서열화하는 방법을 제공하는데, 이와 같은 서열은 표적 핵산에서 제 1 말단과 제 2 말단을 가지는데, 이 방법으로는 (a) 다양한 길이의 스페이스 올리고뉴클레오티드를 여러 개 제공하는데, 이때 스페이스 올리고뉴클레오티드는 반복 서열로 구성되고; (b) 반복 서열의 제 1 말단에 인접한 것으로 알려진 제 1 올리고뉴클레오티드를 제공하고; 반복 서열의 제 2 말단에 인접한 제 2 올리고뉴클레오티드 다수를 제공하고, 이때 다수의 제 2 올리고뉴클레오티드는 라벨된 상태이고; (d) 제 1 올리고뉴클레오티드와 다수의 제 2 올리고뉴클레오티드, 그리고 표적이 되는 핵산에 대한 다수의 스페이스 올리고뉴클레오티드중 하나를 하이브리드시키고; (e) 하이브리드된 올리고뉴클레오티드를 결찰시키고; (f) 결찰안된 올리고뉴클레오티드로부터 결찰된 올리고뉴클레오티드를 분리하고; 그리고 (g) 결찰된 올리고뉴클레오티드에서 라벨을 감지하는 것으로 구성된다.The present invention also provides a method of sequencing a repeating sequence, which sequence has a first terminus and a second terminus in a target nucleic acid, which method comprises: (a) a plurality of space oligonucleotides of various lengths; Wherein the space oligonucleotide consists of a repeating sequence; (b) providing a first oligonucleotide known to be adjacent to a first terminus of the repeat sequence; Providing a plurality of second oligonucleotides adjacent to a second end of the repeat sequence, wherein the plurality of second oligonucleotides are in a labeled state; (d) hybridize one of the plurality of oligonucleotides to the second oligonucleotide and the plurality of space oligonucleotides to the target nucleic acid; (e) ligation of the hybridized oligonucleotides; (f) separating the ligated oligonucleotides from the unligated oligonucleotides; And (g) detecting a label in the ligated oligonucleotide.
또한, 본 발명은 표적 핵산에서 제 1 말단 및 제 2 말단을 가지는 분지점 서열을 서열화하는 방법을 제공하는데, 이 방법은 분지점 서열의 제 1 부분에 상보적인 제 2 올리고뉴클레오티드를 제공하고, 이때 제 1 올리고뉴클레오티드는 분지점 서열의 제 1 말단으로부터 적어도 한 개 뉴클레오티드 정도가 연장되어 있고; (b) 분지점 서열의 제 2 부분에 상보적이고, 라벨된 다수의 제 2 올리고뉴클레오티드를 제공하고, 이때 다수의 제 2 올리고뉴클레오티드는 분지점 서열의 제 2 말단으로부터 적어도 한 개 뉴클레오티드 정도가 연장되어 있고, 분지점 서열에서 발생된 다수의 서열에 상보적이고; (c) 제 1 올리고뉴클레오티드와 다수의 제 2 올리고뉴클레오티드 중 하나를 표적 DNA에 하이브리드시키고; (d) 하이브리드된 올리고뉴클레오티드를 결찰시키고; (e) 결찰안된 올리고뉴클레오티드로부터 결찰된 올리고뉴클레오티드를 분리하고; (f) 결찰된 올리고뉴클레오티드에서 라벨을 감지하는 단계로 구성된다.The present invention also provides a method of sequencing a branch point sequence having a first end and a second end in a target nucleic acid, the method providing a second oligonucleotide complementary to a first portion of the branch point sequence The first oligonucleotide extends at least one nucleotide from the first end of the branch point sequence; (b) providing a plurality of second oligonucleotides that are complementary and labeled to a second portion of the branching sequence, wherein the plurality of second oligonucleotides extend at least one nucleotide from the second end of the branching sequence Is complementary to a plurality of sequences generated in the branching sequence; (c) hybridize the first oligonucleotide and one of the plurality of second oligonucleotides to the target DNA; (d) ligation of the hybridized oligonucleotides; (e) separating the ligated oligonucleotides from the ligated oligonucleotides; (f) detecting the label in the ligated oligonucleotide.
본 발명은 또한 표적이 되는 핵산서열에 음성인 것으로 알려진 프로브를 이용하여 서열을 확인하는 방법을 제공한다. 표적이 되는 핵산 서열은 "음성" 프로브에 표적이 되는 핵산 서열을 하이브리드시킴으로써, 이들 프로브가 표적이 되는 핵산 서열과 완벽한 메취(match) 쌍을 이루지 않는다는 것을 확인함으로써 알 수 있다.The present invention also provides a method for identifying a sequence using a probe known to be negative for a target nucleic acid sequence. Targeted nucleic acid sequences can be identified by hybridizing the targeted nucleic acid sequences to "negative" probes to confirm that these probes do not form a perfect match pair with the targeted nucleic acid sequence.
또한, 본 발명은 여러 가지 라벨과 복합된 올리고뉴클레오티드 프로브를 이용하여 핵산을 분석하는 방법을 제공하는데, 프로브는 서열에 대한 정보를 잃지 않으면서 하이브리드 반응에서 복합될 수 있다(가령, 여러 가지 다른 프로브에 여러 가지 다른 라벨을 함으로써, 표적에 대한 다른 프로브가 하이브리드된 것을 식별할 수 있다). 적절한 구체예에서, 라벨은 방사능동위원소, 형광 분자 또는 효소 또는 전기이동 물질 라벨등이 될 수 있다. 좀더 적절한 구체예에서는 Format III SBH에서는 상이하게 라벨된 올리고뉴클레오티드 프로브를 이용하고, 다중 프로브(한 개 프로브가 고정된 프로브인데 두 개 이상의 것인 경우)도 함께 결찰할 수 있다.The present invention also provides a method for analyzing nucleic acids using oligonucleotide probes complexed with various labels, which probes can be complexed in a hybrid reaction without losing information about the sequence (eg, various other probes). By different labeling, it is possible to identify hybridization of different probes to the target). In suitable embodiments, the label may be a radioisotope, fluorescent molecule or enzyme or electrophoretic material label, and the like. In a more suitable embodiment, differently labeled oligonucleotide probes can be used in Format III SBH, and multiple probes (if one probe is a fixed probe but two or more) can be ligated together.
본 발명의 또 다른 구체예에서는 샘플에서 상동 핵산과 비교하였을 경우에, 표적이 매우 소량 존재하는 경우, 공지 서열을 가지는 표적이 되는 핵산이 있는지를 감지하는 방법을 제공한다. 적절한 구체예에서, 표적이 되는 핵산은 다양한 소스에서 얻은 핵산을 가지는 샘플에서 매우 적은 비율로 존재하는 대립 형질이다. 또 다른 적절한 구체예에서, 표적이 되는 핵산은 돌연변이된 서열을 가지는데, 이는 핵산 샘플 내에 매우 낮은 빈도로 존재한다.Another embodiment of the present invention provides a method for detecting whether a target nucleic acid has a known sequence when compared to a homologous nucleic acid in a sample, when there is a very small amount of the target. In a suitable embodiment, the target nucleic acid is an allele present in a very small proportion in samples having nucleic acids from various sources. In another suitable embodiment, the nucleic acid of interest has a mutated sequence, which is present at a very low frequency in the nucleic acid sample.
본 발명의 또 다른 구체예에서, 한 개의 패스 겔 서열화를 이용하여 표적 서열의 서열을 확인하는 방법을 제공한다. 한 개 패스 겔에 대한 프라이머는 SBH에 의해 수득된 서열에서 유도한 것으로, 이들 프라이머를 표준 Sanger 서열 반응에 이용하여, 표적이 되는 핵산 서열에 대한 겔 서열 정보를 제공한다. 그 다음, 단일 패스 겔 서열화 반응에 의해 얻은 서열을 SBH에 의해 유도된 서열과 비교하여, 서열을 확인한다.In another embodiment of the present invention, a method of identifying the sequence of a target sequence using one pass gel sequencing is provided. Primers for one pass gels are derived from sequences obtained by SBH, and these primers are used in standard Sanger sequence reactions to provide gel sequence information for the target nucleic acid sequence. The sequence is then identified by comparing the sequence obtained by single pass gel sequencing with the sequence derived by SBH.
본 발명은 또한 단일 패스 겔 서열화를 이용하여 분지점을 찾는 방법을 제공한다. 단일 겔 패스 서열과 반응을 위한 프라이머는 SBH 제 1 과정 후에 수득된 Sfs 말단으로 확인하고, 이들 프라이머를 표준 Sanger-서열화 반응에 이용하여, Sfs의 분비점을 통하여 겔 서열 정보를 제공한다. 그 다음, 분지점에서 Sfs까지 Sanger-서열 결과를 비교하여, Sfs를 배열하면, 인접한 Sfs를 확인할 수 있다.The invention also provides a method of finding branch points using single pass gel sequencing. Primers for reaction with a single gel pass sequence are identified by the Sfs terminus obtained after the SBH first step and these primers are used in a standard Sanger-sequencing reaction to provide gel sequence information through the secretion points of Sfs. Then, by comparing the Sanger-sequence results from the branch to the Sfs, arranging the Sfs, we can see the adjacent Sfs.
본 발명은 또한 SBH 반응 전에 PCR 생성물을 정제할 필요 없이 PCR에 의해 표적이 되는 핵산을 포함하는 샘플을 준비하는 방법을 제공한다. Format I SBH에서, 정제안된 PCR 생성물은 사전에 정제를 하지 않고 기질에 사용할 수 있고, 라벨된 프로브를 도입하기 전에 기질은 세척한다.The invention also provides a method of preparing a sample comprising a nucleic acid targeted by PCR without the need to purify the PCR product prior to the SBH reaction. In Format I SBH, the unpurified PCR product can be used on the substrate without prior purification and the substrate is washed before introducing the labeled probe.
본 발명은 또한 표적이 되는 핵산을 분석하는 방법 및 장치를 제공한다. 이 장치는 원하는 시간에 혼합된 두 개 핵산 배열로 구성된다. 적절한 구체예에서, 배열중 한 개에 있는 핵산을 라벨한다. 좀더 적절한 구체예에서, 두 개 배열사이에 물질을 배치하여, 이 물질로 인하여 배열 상에 핵산이 혼합되는 것을 방지한다. 또 다른 적절한 구체예에서, 한 배열에 있는 핵산은 표적 핵산이고, 다른 배열에 있는 것은 올리고뉴클레오티드 프로브이다. 또 다른 적절한 구체예에서, 두 배열에 존재하는 핵산은 모두 올리고뉴클레오티드 프로브이다. 또 다른 적절한 구체예에서, 한 배열에 있는 핵산은 올리고뉴클레오티드 프로브 및 표적이 되는 핵산이도, 다른 배열에 있는 핵산은 올리고뉴클레오티드 프로브이다. 또 다른 적절한 구체예에서, 두 개 배열에 있는 핵산은 올리고뉴클레오티드 프로브 및 표적 핵산이 된다.The invention also provides methods and apparatus for analyzing a target nucleic acid. The device consists of two nucleic acid sequences mixed at the desired time. In suitable embodiments, the nucleic acid in one of the arrays is labeled. In a more suitable embodiment, a substance is placed between the two arrays to prevent mixing of nucleic acids on the array due to the substance. In another suitable embodiment, the nucleic acid in one array is the target nucleic acid and the other in the array is an oligonucleotide probe. In another suitable embodiment, the nucleic acids present in both arrays are oligonucleotide probes. In another suitable embodiment, the nucleic acid in one array is an oligonucleotide probe and a target nucleic acid, while the nucleic acid in another array is an oligonucleotide probe. In another suitable embodiment, the nucleic acids in the two arrays are oligonucleotide probes and target nucleic acids.
상기에서 설명하는 장치를 이용한 본 발명의 한 가지 방법은 다음의 단계로 구성된다;One method of the present invention using the apparatus described above consists of the following steps;
- 기질에 고정된 핵산 배열을 제공하고;Providing a nucleic acid arrangement immobilized on a substrate;
- 고정된 배열의 핵산과 접촉할 수 있는 조건하에 제 2 배열의 핵산을 제공하는데, 이때 핵산 배열중 하나는 표적이 되는 핵산이고, 다른 배열은 올리고뉴클레오티드 프로브이며;Providing a second array of nucleic acids under conditions capable of contact with a fixed array of nucleic acids, where one of the nucleic acid sequences is the target nucleic acid and the other array is an oligonucleotide probe;
- 하이브리드 반응 결과를 분석하는 단계로 구성된다. 적절한 구체예에서, 고정된 배열이 표적이 되는 핵산이 되고, 제 2 배열이 라벨된 올리고뉴클레오티드 프로브가 된다. 좀더 적절한 구체예에서, 두 배열사이에 물질을 배치하여, 이 물질을 제거할 때까지 배열간 혼합되는 것을 방지한다.Analyzing the hybrid reaction results. In a suitable embodiment, the immobilized arrangement becomes the target nucleic acid and the second arrangement becomes the labeled oligonucleotide probe. In a more suitable embodiment, material is placed between the two arrays to prevent mixing between the arrays until the material is removed.
상기에서 설명하는 본 발명의 제 2 방법은 다음과 같다;The second method of the present invention described above is as follows;
- 두 가지 배열의 핵산 프로브를 제공하는데,Providing two arrays of nucleic acid probes,
- 이들 두 배열이 서로 접촉하고, 그리고 표적이 되는 핵산과 접촉하도록 조건을 제공하고;Providing conditions such that these two arrangements are in contact with each other and with the target nucleic acid;
- 표적 핵산에 인접한 프로브와 함께 결찰시키고;Ligation with probes adjacent to the target nucleic acid;
- 그 결과를 분석하는 것으로 구성된다. 적절한 구체예에서는, 한 배열에 있는 프로브는 고정시키고, 다른 배열에 있는 프로브는 라벨한다. 좀더 적절한 구체예에서, 두 배열사이에는 물질을 배치하여, 물질이 제거될 때까지 두 가지 프로브가 혼합되지 않도록 한다.-Analysis of the results. In suitable embodiments, the probes in one array are fixed and the probes in the other array are labeled. In a more suitable embodiment, material is placed between the two arrays such that the two probes are not mixed until the material is removed.
또한, 본 발명은 올리고뉴클레오티드 프로브 배열이 고정된 기질을 제공하는데, 이때 각 프로브는 샘플 용액의 흐름을 방해하는 물리적인 장벽으로 인하여 인접하는 프로브와 구별된다. 적절한 구체예에서, 물리적인 장벽은 소수성 물질로 만든다.The present invention also provides a substrate in which an oligonucleotide probe array is immobilized, wherein each probe is distinguished from adjacent probes due to physical barriers that impede the flow of the sample solution. In a suitable embodiment, the physical barrier is made of hydrophobic material.
또한, 본 발명은 물리적인 장벽에 의해 구별되는 올리고뉴클레오티드 프로브 배열을 만드는 방법을 제공한다. 적절한 구체예에서, 배열의 반응 용적을 줄이는 물질을 공급하는 잉크-젯 헤드를 이용하여 기질에 격자를 제공한다.The present invention also provides a method of making oligonucleotide probe arrays distinguished by physical barriers. In a suitable embodiment, a lattice is provided to the substrate using an ink-jet head that supplies a substance that reduces the reaction volume of the arrangement.
또한, 본 발명은 3차원 배열을 형성시키기 위해, 올리고뉴클레오티드가 고정된 기질을 제공한다. 3차원 배열에는 프로브 결과(각 레벨에는 ㎠당 상대적으로 낮은 밀도의 프로브를 가짐)를 일기 위해, 3차원 공간에서 많은 정보(다수 레벨 또는 프로브)와 복합된다.The present invention also provides a substrate to which an oligonucleotide is immobilized to form a three-dimensional array. Three-dimensional arrays are compounded with a lot of information (multiple levels or probes) in three-dimensional space in order to present the probe results (each level with a relatively low density of probes per cm 2).
또한, 본 발명은 올리고뉴클레오티드 프로브가 고정된 기질을 제공하는데, 이때 올리고뉴클레오티드 프로브는 스페이스를 가지고, 스페이스는 기질과 올리고뉴클레오티드 프로브의 정보 부분(표적에 결합하여, 서열 정보를 제공하는 올리고뉴클레오티드 프로브의 부분)사이의 거리를 증가시킨다. 적절한 구체예에서, 스페이스는 리보스 당 및 인산염으로 구성되는데, 이때 인산염은 리보스 당의 5' 및 3' 하이드록실기를 통하여 리보스 당과 에스테르를 만들어, 리보스 당과 공유적으로 결합하여, 폴리머를 만든다.The present invention also provides a substrate to which an oligonucleotide probe is immobilized, wherein the oligonucleotide probe has a space, the space of the oligonucleotide probe that binds to the information portion of the substrate and the oligonucleotide probe to provide sequence information. Increase the distance between parts). In a suitable embodiment, the space consists of a ribose sugar and a phosphate salt, where the phosphate forms esters with the ribose sugar through the 5 'and 3' hydroxyl groups of the ribose sugar and covalently binds with the ribose sugar to form a polymer.
또한, 본 발명은 cDNA 클론을 유사한 또는 동일한 서열을 가지는 군으로 모우는 방밥을 제공하여, 각 클론은 각 집단을 서열화하는데 선택된다. 적절한 구체예에서, 모우는 방법은 다수의 클론을 서열화하는데 이용되는데, 이 방법은 각 클론에 다수의 올리고뉴클레오티드 프로브로 신호를 보내고; 유사한 프로브에 유사한 강도로 결합하는 클론을 확인함으로써 클론을 다수의 군으로 모으고; 각 군에서 적어도 한 개의 클론을 서열화시키는 단계로 구성된다. 좀더 적절한 구체예에서, 다수의 프로브는 약 50 내지 500개 상이한 프로브로 구성된다. 또 다른 적절한 구체예에서는 다수의 프로브는 약 300개 상이한 프로브로 구성된다. 가장 적절한 구체예에서, 다수의 클론은 다수의 cDNA 클론이 된다.In addition, the present invention provides a method for bringing cDNA clones into groups with similar or identical sequences, such that each clone is selected to sequence each population. In suitable embodiments, the pooling method is used to sequence multiple clones, which signal each clone to multiple oligonucleotide probes; Pool the clones into multiple groups by identifying clones that bind to similar probes at similar strength; Sequencing at least one clone in each group. In a more suitable embodiment, the plurality of probes consists of about 50 to 500 different probes. In another suitable embodiment the plurality of probes consists of about 300 different probes. In the most suitable embodiment, the plurality of clones is a plurality of cDNA clones.
또한 본 발명은 별개의 입자에 복합(공유 또는 비공유결합)된 올리고뉴클레오티드 프로브에 관계하는데, 이때 입자는 이들의 물리적인 성질에 기초하여 다수의 세트로 나뉠 수 있다. 적절한 구체예에서, 상이한 프로브는 각 세트의 별개 입자에 부착되고, 프로브 확인은 별개 입자의 물리적인 성질에 따라 이루어진다. 또 다른 구체예에서, 프로브는 프로브의 물리적인 성질에 따라서 확인된다. 물리적인 성질에는 별개 입자들을 구별하는데 이용되는 임의의 것이 포함되는데, 가령, 크기, 형광, 방사능활성, 전자기 전하, 흡수도등이 포함되고, 염료, 방사능뉴클리드 또는 EML와 같은 입자에 부착될 수 있는 라벨등이 포함된다. 적절한 구체예에서, 별개 입자는 입자의 크기, 전하, 형광, 흡수도를 감지하는 유동 세포계에 의해 분리된다.The invention also relates to oligonucleotide probes complexed (covalently or non-covalently) to separate particles, wherein the particles can be divided into a number of sets based on their physical properties. In suitable embodiments, different probes are attached to each set of separate particles, and probe identification is made according to the physical properties of the separate particles. In another embodiment, the probe is identified according to the physical properties of the probe. Physical properties include any used to distinguish discrete particles, including size, fluorescence, radioactivity, electromagnetic charge, absorbance, etc., and can be attached to particles such as dyes, radionuclides or EMLs. Included labels are included. In suitable embodiments, the separate particles are separated by a flow cell system that senses the size, charge, fluorescence, and absorbance of the particles.
또한 본 발명은 표적 핵산을 분석하기 위해 별개 입자에 복합된 프로브를 이용하는 방법에 관계한다. 이와 같은 프로브는 상기에서 설명하는 임의 방법에서 이용할 수 있는데, 이때 별개 입자의 물리적인 성질을 이용하여 프로브를 확인하는 것이다. 이와 같은 프로브는 format Ⅲ 방식에 이용되는데, 자유("free") 프로브는 라벨에 의해 확인되고, 물리적인 성질에 의해 별개 입자에 복합된 프로브를 확인할 수 있다. 적절한 구체예에서, 프로브는 SBH를 이용하여 표적 핵산을 서열화시키는데 이용된다.The invention also relates to methods of using probes conjugated to separate particles to analyze target nucleic acids. Such probes can be used in any of the methods described above, wherein the probes are identified using the physical properties of the discrete particles. Such a probe is used in a format III method. A "free" probe is identified by a label, and physical probes can be used to identify probes complexed with separate particles. In a suitable embodiment, the probe is used to sequence the target nucleic acid using SBH.
본 발명은 상보적인 폴리뉴클레오티드 가닥의 결합을 불안정(결합 에너지를 감소)화시키는 또는 상보적인 폴리뉴클레오티드 가닥간의 결합 안정성을 증가(결합 에너지 증가)시키는 물질을 이용하는 방법이다. 적절한 구체예에서, 물질은 트리알킬 암모니움 염, 염화나트륨, 인산염, 붕산염, 포름아미드, 글리콜, 디메틸설폭시드, 디메틸포름아미드, 요소, 구아니디움과 같은 유기 용매, 베타인과 같은 아미노산 유도체, 스페르미딘, 스페르민과 같은 폴리아민 또는 인산염 골격의 음전하를 중화시킬 수 있는 양전하를 띈 분자, 쇼듐 도데실 설페이트, 쇼듐 라우릴 설페이트와 같은 계면활성제, 작은/큰 홈 결합 물질, 양정하를 띈 폴리펩티드, 아크리딘 또는 에티디움 브로마이드와 같은 삽입제, 안트라신등이 된다. 적절한 구체예에서, 물질을 이용하여 상보적인 폴리뉴클레오티드 쌍의 Tm을 증가 또는 감소시킨다. 좀더 적절한 구체예에서, 물질 혼합물을 이용하여 상보적인 폴리뉴클레오티드의 Tm을 감소 또는 증가시킨다. 가장 적절한 구체예에서, 물질 또는 물질 혼합물을 이용하여 상보적인 폴리뉴클레오티드에서 미스메취된 것으로부터 완전하게 메취된 것을 구별할 수 있게 한다. 적절한 구체예에서, 물질을 첨가하여, AT 결합 쌍의 결합 에너지는 GC 결합 쌍의 결합 에너지와 거의 등가가 되도록 한다. 이와 같은 상보적인 폴리뉴클레오티드의 결합 에너지는 폴리뉴클레오티드 기본구조에서 인산 기의 음전하를 차단하는 또는 중화시키는 물질을 첨가시키면, 증가된다.The present invention is a method of using a substance that destabilizes the binding of complementary polynucleotide strands (reduces binding energy) or increases the binding stability between complementary polynucleotide strands (increase binding energy). In a suitable embodiment, the substance is a trialkyl ammonium salt, sodium chloride, phosphate, borate, formamide, glycol, dimethylsulfoxide, dimethylformamide, urea, organic solvents such as guanidium, amino acid derivatives such as betaine, spermi Positively charged molecules that can neutralize the negative charges of polyamines or phosphate backbones such as dine, spermine, surfactants such as sodium dodecyl sulfate, sodium lauryl sulfate, small / large groove binding materials, positively charged polypeptides, Intercalating agents such as acridine or ethidium bromide, anthracene, and the like. In suitable embodiments, the material is used to increase or decrease the T m of the complementary polynucleotide pair. In a more suitable embodiment, the material mixture is used to reduce or increase the T m of the complementary polynucleotide. In the most suitable embodiment, the substance or mixture of substances can be used to distinguish completely embroidered from mismatched in complementary polynucleotides. In suitable embodiments, materials are added such that the binding energy of the AT bond pair is approximately equivalent to the binding energy of the GC bond pair. The binding energy of such complementary polynucleotides is increased by adding a substance that blocks or neutralizes the negative charge of phosphate groups in the polynucleotide framework.
본 특허 출원은 미국 특허 출원 08/912,885(August 15, 1997), 미국 특허 출원 08/947,779(October 9, 1997), 미국 특허 출원 08/892,503(July 14, 1997)의 연속 출원이고, 또한 본 출원은 1997년 3월 4일자 출원된 미국 특허 출원 08/812,951의 연속출원이고, 1997년 1월 16일자 출원된 미국 출원 08/784,747의 연속출원이다.This patent application is a continuation of US patent application 08 / 912,885 (August 15, 1997), US patent application 08 / 947,779 (October 9, 1997), US patent application 08 / 892,503 (July 14, 1997), and also the present application Is a serial application of US patent application 08 / 812,951, filed March 4, 1997, and a serial application of US application 08 / 784,747, filed January 16, 1997.
본 발명은 핵산 분석을 하는 방법 및 그 장치 특히 핵산 분석 방법 및 그 장치에 관계한다.The present invention relates to a method and apparatus for performing nucleic acid analysis, in particular, a method and apparatus for nucleic acid analysis.
도 1은 프로브 배열을 만드는 물질의 평면도이다.1 is a plan view of a material making up the probe array.
도 2는 프로브 배열을 만드는 물질의 측면도이다.2 is a side view of the material making up the probe array.
도 3은 프로브 배열을 만드는 장치의 분배 유닛의 확대된 측면도이다.3 is an enlarged side view of the dispensing unit of the device making the probe arrangement.
부호설명Description
1-실린더, 2-암, 3-분배장치, 6-저장기, 7-공급 라인1-cylinder, 2-arm, 3-dispenser, 6-reservoir, 7-supply line
8, 14-분배 팁, 9-쳄버, 10-샘플 라인, 11-압력 라인8, 14-dispensing tip, 9-chamber, 10-sample line, 11-pressure line
12-몸체, 13-샘플 웰12-body, 13-sample well
많은 세트의 샘플을 동시에 분석하는 경우에, Format 1 SBH가 적합하다. 작은 막을 이용하여 수천가지 각각 독립된 하이브리드 반응을 이용하여, 큰 배열 상에 수천가지 샘플을 나란히 배열할 수 있다. 반응당 1-20개 프로브를 이용하여 DNA를 확인하고, 일부 경우 돌연변이를 확인하는 경우에는 각 샘플에 대해 특이적인 1000개이상의 프로브를 이용한다. 돌연변이된 DNA 단편의 특징을 확인하기 위해서는, 하이브리드 반응의 제 1 과정에서 감지되는 각 돌연변이에 대해 특정한 또는 선택된 특정 프로브를 이용해야 한다.When analyzing many sets of samples simultaneously, Format 1 SBH is suitable. Thousands of samples can be arranged side by side on large arrays using thousands of independent hybrid reactions using small membranes. DNA is identified using 1-20 probes per reaction, and in some cases more than 1000 probes specific for each sample are used to identify mutations. To characterize the mutated DNA fragments, one must use a specific or selected specific probe for each mutation detected in the first course of the hybrid reaction.
DNA 샘플은 적절한 스페이스에 의해 분리되어 있는 작은 배열로 준비하고, 다중 웰 플레이트에 배열된 올리고뉴클레오티드 세트에서 선택된 프로브와 동시에 테스트한다. 소 배열은 한가지 이상의 샘플로 구성된다. 각 배열에 있는 DNA 샘플에는 돌연변이 서열 또는 개별 샘플 서열이 포함될 수 있다. 계속되는 소 배열이 더 큰 배열로 편성될 수 있다. 이와 같은 더 큰 배열에는 동일한 소 배열 복제물 또는 상이한 DNA 단편으로된 배열이 포함될 수 있다. 완전한 프로브 세트에는 미리 설정된 정확도 DNA 단편을 분석할 수 있을 정도의 충분한 양의 프로브가 포함되는데, 예를 들면, 각 염기쌍("bp")을 읽는데 과도한 정도의 양을 포함한다. 이들 세트에는 한 개 특정 단편에 대해 필요이상의 프로브가 포함되나, 다른 서열을 가진 수천가지 DNA 샘플을 테스트하는데 필요한 것보다 적은 수의 프로브가 포함될 수 있다.DNA samples are prepared in small arrays separated by appropriate spaces and tested simultaneously with probes selected from a set of oligonucleotides arranged in multiple well plates. The small array consists of one or more samples. DNA samples in each array may include mutant sequences or individual sample sequences. Subsequent small arrays can be organized into larger arrays. Such larger sequences may include sequences of identical sub-species copies or different DNA fragments. The complete probe set includes a sufficient amount of probes to analyze predetermined accuracy DNA fragments, including an excessive amount of reading each base pair ("bp"), for example. These sets include more probes than are needed for one particular fragment, but may contain fewer probes than necessary to test thousands of DNA samples with different sequences.
DNA 또는 대립형질 확인 및 특징적인 서열화 과정에는 다음의 단계가 포함된다;DNA or allele identification and characteristic sequencing processes include the following steps;
1) 다수의 소 배열 각각에 하이브리드할 수 있는 완전한 세트 또는 대표적인 프로브 세트로부터 서브세트 프로브를 선택하고;1) selecting a subset probe from a complete set or representative probe set capable of hybridizing to each of a plurality of small arrays;
2) 분석할 각 배열 상에 각 하위 배열에 나란하게 제 1 프로브를 첨가하고;2) add a first probe side by side in each subarray on each array to be analyzed;
3) 하이브리드 반응을 실행하고, 하이브리드 반응의 결과를 기록하고;3) run the hybrid reaction and record the result of the hybrid reaction;
4) 이미 이용된 프로브를 제거하고;4) remove the probes already used;
5) 하이브리드 반응을 반복하고, 기록하고, 남아있는 프로브를 제거하고;5) repeat the hybrid reaction, record and remove remaining probes;
6) 얻은 결과를 처리하여 최종 분석을 하거나 하이브리드된 추가 프로브를 결정하고;6) process the obtained results for final analysis or to determine hybrid additional probes;
7) 특정 소배열에 대해 추가 하이브리드를 실시하고;7) perform additional hybridization on specific subarrays;
8) 완전한 데이터 세트를 처리하고, 최종 분석을 한다.8) Process the complete data set and do a final analysis.
이와 같은 방법으로 한 가지 형태의 소수 핵산(가령, DNA, RNA)을 신속하게 확인하고, 서열화하고, 또한 미리 합성된 프로브 세트(적절한 길이)를 이용하여 하위배열의 형태의 많은 샘플 형을 나란히 분석한다. 두 가지 방법을 복합하여 DNA 실체를 결정하고, DNA 진단 및 돌연변이를 확인하는데 있어서 효과적이고, 다양한 공정을 만들 수 있다.In this way, one type of minority nucleic acid (eg, DNA, RNA) can be quickly identified, sequenced, and analyzed side by side with many sample types in the form of subarrays using pre-synthesized probe sets (suitable length). do. The two methods can be combined to make a variety of processes that are effective in determining DNA identity, identifying DNA, and identifying mutations.
공지의 서열을 확인하기 위해서, 긴 독특한 프로브대신에 짧은 프로브 세트를 이용한다. 이와 같은 방법에서, 기록할 프로브가 더 많지만, 완전한 프로브 세트를 합성하여 임의 형태 서열을 포함할 수 있다. 예를 들면, 6-mer 완전한 세트에는 4,096개의 프로브만이 포함되고, 7-mer 완전한 세트에는 16,384개의 프로브만 포함된다.To identify known sequences, short probe sets are used instead of long unique probes. In this method, there are more probes to record, but a complete set of probes can be synthesized to include any form sequence. For example, the 6-mer complete set contains only 4,096 probes and the 7-mer complete set contains only 16,384 probes.
두 가지 수준의 하이브리드 반응을 행하여, DNA 단편을 완전하게 서열화할 수 있다. 한 가지 방법은 적어도 한번은 모든 염기에 해당되는 충분한 세트의 프로브로 하이브리드 반응을 하는 것이다. 이를 위해, 특정 세트의 프로브를 표준 샘플에 대해 합성한다. 이와 같은 프로브 세트로 하이브리드한 결과는 비-표준 샘플에 돌연변이가 있는지, 어디에 있는지(차이)를 알 수 있게 한다. 또한, 이와 같은 프로브 세트에는 "음성" 프로브가 포함되어 "양성" 프로브의 하이브리드 반응 결과를 확인할 수 있다. 변화의 실체를 결정하기 위해, 추가 특정 프로브를 샘플에 하이브리드할 수 있다. 이와 같은 추가 프로브 세트는 "양성"(돌연변이 서열) 프로브 및 "음성" 프로브를 모두 포함하여, 양성 프로브에 의해 서열 변화를 찾아내고, 음성 프로브를 이용하여 이와 같은 변화를 확인한다.Two levels of hybridization can be performed to fully sequence DNA fragments. One method is to hybridize at least once with a sufficient set of probes for all bases. To this end, a specific set of probes is synthesized against a standard sample. Hybridization with this set of probes allows us to know where and where (differences) mutations exist in non-standard samples. In addition, such a probe set may include a "negative" probe to confirm the hybrid reaction result of the "positive" probe. To determine the substance of the change, additional specific probes can be hybridized to the sample. Such additional probe sets include both “positive” (mutated sequence) probes and “negative” probes to detect sequence changes by positive probes and to identify such changes using negative probes.
또 다른 구체예에서, 완전한 세트에 있는 모든 프로브를 얻을 수 있다. 완전한 세트의 프로브를 이용하면, 불필요한 시간 소비 없이 2단계 공정에서 샘플간 상대적으로 소량의 프로브를 얻을 수 있다. 하이브리드 반응 공정은 연속적으로 프로브하는 단계로 우선 처음에 하이브리드될 적절한 프로브 세트를 계산하고, 2단계에서는 다음 얻은 결과를 바탕으로 완전한 세트 가운데에서 추가 얻어야 할 프로브를 결정한다. 두 가지 세트의 프로브 모두 세트에서 양성 프로브를 확인해줄 "음성" 프로브를 가지고 있다. 또한, 수득된 서열은 그 다음 별도 단계에서 SBH 결과에서 확인된 "음성" 프로브 세트와 샘플을 하이브리드 하여 확인할 수 있다.In another embodiment, all probes in the complete set can be obtained. With a complete set of probes, relatively small amounts of probes between samples can be obtained in a two-step process without unnecessary time consumption. The hybrid reaction process is a step of continuous probes, which first calculates the appropriate set of probes to be hybridized first, and then determines which probes should be further obtained from the complete set based on the results obtained next. Both sets of probes have "negative" probes to identify positive probes in the set. In addition, the obtained sequence can then be identified by hybridizing the sample with the "negative" probe set identified in the SBH results in a separate step.
SBH 서열을 조합할 때, 우연한 또는 생물학적 이유로 인하여, 분석한 DNA 단편에서 반복적으로 발생하는 K-1 올리고뉴클레오티드를 특별히 고려한다. 추가 정보가 없는 경우에, 상대적으로 적은 양의 DNA를 완전히 조립하여 모든 염기 쌍이 여러 번 읽히게 된다.When combining SBH sequences, special consideration is given to K-1 oligonucleotides that occur repeatedly in the analyzed DNA fragments, either for accidental or biological reasons. In the absence of additional information, a relatively small amount of DNA is completely assembled so that all base pairs are read multiple times.
상대적으로 긴 단편을 조합하는 경우에, K-1 서열의 양성-으로 기록된 프로브 세트에서 반복 발생으로 인하여 애매한 경우가 발생한다(가령, 프로브 길이보다 더 짧은 서열). 돌연변이된 또는 유사한 서열을 결정할 경우에 이와 같은 문제는 발생하지 않는다(가령, K-1 서열이 동일하게 반복되지 않는다). 한 서열에 대한 지식을 주형으로 이용하여, 주형에 가장 잘 맞는 미지 서열에 대해 양성 프로브를 배열하여 유사한 것으로 알려진 서열을 정확하게 조합한다(데이타베이스에 이의 존재를 확인).In the case of combining relatively long fragments, an ambiguous case occurs due to recurrence in a positively-recorded probe set of K-1 sequences (eg, sequences shorter than probe length). This problem does not arise when determining mutated or similar sequences (eg, K-1 sequences are not identically repeated). Using the knowledge of one sequence as a template, the positive probes are arranged for the unknown sequence that best fits the template to accurately combine the sequences known to be similar (identify their presence in the database).
샘플 배열을 이용하여, 한 개 샘플 또는 작은 샘플 세트 상에 많은 올리고뉴클레오티드가 연속적으로 기록되는 것을 피할 수 있다. 이와 같은 방법을 이용하여, 한 개의 물리적인 목표만을 조절함으로써 나란하게 더 많은 프로브를 기록할 수 있다. 상대적으로 짧은 시간동안에 길이가 1000bp인 DNA 소배열을 서열화할 수 있다. 샘플을 50개 소배열에 스팟할 경우에, 배열은 10번 프로브를 반복하여, 500개 프로브를 기록할 수 있다. 돌연변이 발생에 대해 스크린하는 경우에, 충분한 양의 프로브를 이용하여 각 염기를 3회 커브하게 한다. 돌연변이가 존재하는 경우에, 몇번 커버된 염기가 영향을 받을 것이다. 음성 프로브 실체에 대한 정보를 이용하면 두 개 염기 정확도로 돌연변이에 대한 지도를 작성할 수 있다. 이와 같은 방법으로 작성된 단일 염기 돌연변이를 찾기 위해, 추가 15개 프로브를 이용할 수 있다. 이와 같은 프로브는 두 개 의문이 가는 위치에 대해 임의 염기 복합물을 커브할 수 있다(결손 및 삽입이 관련되지 않았을 것으로 추정). 이들 프로브는 주어진 샘플을 포함하는 50개 소배열에서 한 개 과정에서 기록된다. 여러 라벨 색을 이용하여 실행하는 경우에(multiplexing), 2 내지 6개 프로브(각 프로브는 상이한 형광 색으로 다르게 라벨됨)를 함께 이용하여, 하이브리드 과정의 횟수를 줄이고, 서열화 공정을 단축시킨다.Sample arrangements can be used to avoid the continuous recording of many oligonucleotides on one sample or a small set of samples. Using this method, more probes can be recorded side by side by adjusting only one physical target. In a relatively short time, DNA subarrays of 1000 bp in length can be sequenced. If the sample is spotted into 50 small arrays, the array can repeat 10 probes, recording 500 probes. When screening for mutagenesis, use a sufficient amount of probe to curve each base three times. If a mutation is present, the base covered several times will be affected. Information about negative probe entities can be used to map mutations with two bases of accuracy. To find single base mutations created in this manner, an additional 15 probes can be used. Such probes can curve arbitrary base complexes for the two questionable locations (presumably not related to deletions and insertions). These probes are recorded in one procedure in 50 subarrays containing a given sample. When multiplexing with multiple label colors, two to six probes (each probe is labeled differently with different fluorescent colors) are used together to reduce the number of hybridization steps and shorten the sequencing process.
좀더 복잡한 경우는, 두 개의 인접한 돌연변이 또는 삽입이 된다. 이는 더 많은 프로브로 다루어야 한다. 예를 들면, 3개 염기가 삽입된 경우에는 64개 프로브를 이용해야 한다. 가장 복잡한 경우는 몇 단계의 하이브리드 반응으로 접근해야 하는데, 기존의 하이브리드 반응 결과를 기초하여 새로운 프로브 세트를 선택해야 한다.In more complex cases, there are two adjacent mutations or insertions. This should be handled with more probes. For example, if three bases are inserted, 64 probes should be used. In the most complex cases, a few stages of hybrid reactions should be approached, and new probe sets should be selected based on the results of existing hybrid reactions.
분석할 소배열에 한가지 타입의 수십 또는 수백 개의 샘플이 포함되는 경우에, 이들중 일부에는 한가지 이상의 변화(돌연변이, 삽입 또는 결손)가 포함되었음을 알 수 있다. 돌연변이가 발생한 각 단편의 경우에, 특정 프로브 세트를 이용해야 한다. 각 샘플에 기입되는 프로브 전체 수는 수백만개가 될 수 있다. 나란하게 레플리카(replica)를 기입하면 상대적으로 적은 횟수에서 수백만개 프로브를 기입할 수 있다. 또한, 호환성있는 프로브를 모을 수 있다. 특정 DNA 단편이 이들 구성 염기중 75%정도가 상이하기 때문에, 양성 하이브리드 반응에 특정 DNA 단편을 점검하도록 선택된 프로브를 할당할 수 있다.If the subarray to be analyzed contains tens or hundreds of samples of one type, it can be seen that some of them contained one or more changes (mutations, insertions or deletions). For each fragment that is mutated, a specific set of probes should be used. The total number of probes written into each sample can be millions. By writing replicas side by side, you can write millions of probes in a relatively small number of times. In addition, compatible probes can be collected. Since specific DNA fragments differ by approximately 75% of these constituent bases, a probe selected to assign specific DNA fragments to positive hybrid reactions can be assigned.
길이가 더 긴 프로브로 된 더 큰 세트를 이용함으로써, 더 긴 표적을 분석할 수 있다. 이들 표적은 엑손 클론 모음과 같은 단편 모음이다.By using a larger set of longer probes, longer targets can be analyzed. These targets are collections of fragments, such as exon clone collections.
특이적인 하이브리드 기록 방법을 이용하면, 배수 염색체 세트에서 서열화되는 게놈 단편에 돌연변이가 있는지를 알 수 있다. 두 개 변수가 있는데; 1) 한 개 염색체 서열은 공지의 대립형질을 나타내고, 다른 서열은 새로운 돌연변이를 나타내거나 또는 2) 두 개 염색체에 새로운 그러나 다른 돌연변이를 포함한다. 이들 두 가지 경우에, 지도를 변화하도록 고안된 스캐닝 단계에서 돌연변이가 있는 위치에서 2배의 최대 시그날 차이를 제공한다. 또한, 이 방법을 이용하여, 개별적으로 유전자의 대립형질을 가지는지 그리고 그 유전자에 대해 각 개체는 상동적인지 이형적인지를 확인할 수 있다.Specific hybrid recording methods can be used to determine if there is a mutation in the genomic fragments that are sequenced in the fold chromosome set. There are two variables; 1) one chromosomal sequence represents a known allele, the other sequence represents a new mutation, or 2) a new but different mutation on the two chromosomes. In these two cases, the scanning step designed to change the map provides a twofold maximum signal difference at the location of the mutation. In addition, this method can be used to determine whether each gene has an allele individually and whether each individual is homologous or heterologous to that gene.
상동 및 이형 기준에 상응하는 시그날을 비교함으로써, 제 1 경우에 요구되는 2배 신호 차이를 효과적으로 기입할 수 있다. 이와 같은 방법을 이용하면, 주어진 각 샘플에 있는 각 특정 프로브에 있어서 하이브리드 반응 시그날이 상대적으로 감소되었는지를 결정할 수 있다. 동일한 완전하게 일치되는 표적을 가지는 상이한 핵산 단편에 하이브리드되는 특정 프로브의 경우에 하이브리드반응 효과가 2배 이상 다양하게 되기 때문에, 상당히 중요하다. 또한, 상이한 돌연변이 부위는 올리고뉴클레오티드 프로브 수에 따라 한 개 이상의 프로브에 영향을 분자. 2 내지 4개 연속 프로브에 대한 시그날이 감소됨으로써 돌연변이 부위를 좀더 신중하게 나타낸다. 미스메취를 포함하는 이중나선에서 발생된 시그날보다 평균 8배 이상강한 완전하게 일치된 스그날을 제공하기 위해 선택된 한 개이상의 프로브중에 선택된 프로브 소세트를 이용하여 그 결과를 점검할 수 있다.By comparing the signals corresponding to the homology and release criteria, the double signal difference required in the first case can be effectively written. Using this method, it is possible to determine whether the hybrid reaction signal is relatively reduced for each particular probe in each given sample. Of particular interest, the hybridization effect is more than doubled for certain probes that hybridize to different nucleic acid fragments having the same perfectly matched target. In addition, different mutation sites affect one or more probes depending on the number of oligonucleotide probes. The signal for the two to four consecutive probes is reduced, indicating the mutation site more carefully. The results can be checked using a probe subset selected from one or more selected probes to provide a perfectly matched signal that is on average eight times stronger than signals generated in a double helix containing mismatches.
분할된 막을 이용하면, 매우 유동성있는 실험을 하여, 주어진 서열 형을 제공하는 상대적으로 많은 수의 샘플을 실험하거나 또는 상대적으로 작은 수의 샘플로 그 형태가 다양한 샘플을 실험할 수 있다. 효과적으로 취급할 수 있는 샘플 수의 범위는 4-256개 정도이다. 올리고뉴클레오티드를 보관하고 라벨링하는데 이용되는 표준 다중웰 플레이트의 크기와 모양에 맞도록 다수의 도트 범위를 가지는 소배열을 만든다. 소배열의 크기는 다른 샘플 수에 맞도록 조정하거나 또는 몇 가지 표준 소배열 크기를 이용할 수 있다. 모든 샘플 형태에 한 배열에 맞지 않기 때문에 추가 배열 또는 막을 이용하여 동일한 프로브로 진행한다. 또한, 각 소배열 레플리카(replica) 수를 조정하여, 확인 및 서열화 공정을 완료하는데 소요되는 시간을 다양하게 한다.Using partitioned membranes, highly fluid experiments can be performed to test a relatively large number of samples giving a given sequence type, or a variety of samples with a relatively small number of samples. The number of samples that can be effectively handled ranges from 4 to 256. Small arrays with multiple dot ranges are created to fit the size and shape of standard multiwell plates used to store and label oligonucleotides. The size of small arrays can be adjusted to accommodate different sample numbers, or some standard small array sizes are available. Proceed to the same probe using additional arrays or membranes because they do not fit into one array for all sample types. In addition, the number of each subarray replica is adjusted to vary the time taken to complete the identification and sequencing process.
여기에서 사용된 것과 같이, "중간 단편"이란 의미는 길이가 5 내지 1000개 염기 적절하게는 길이가 10 내지 40bp를 말한다.As used herein, the term "middle fragment" refers to 5 to 1000 bases in length, preferably 10 to 40bp in length.
Format 3의 경우에, 각 상보 서열을 가지는 핵산에 프로브가 하이브리드될 수 있는 조건하에 공지의 서열을 가지는 올리고뉴클레오티드 프로브 제 1 세트를 고형 서포트에 고정시킨다. 라벨된 오리고뉴클레오티드 프로브 제 2 세트를 용액으로 제공한다. 이들 세트간에 그리고, 세트 내에서 동일한 길이의 프로브 및 다른 길이의 프로브가 있다. 서열화할 핵산 또는 이의 중간 단편은 이중 가닥형으로 있는 프로브 제 1 세트(특히, 비변성 조건하에 하이브리드반응을 허용하는 recA 단백질이 있는 부분)에 제공하거나 단일가닥 형으로 있는 프로브에 제공하는데, 이때 조건은 여러 정도의 상보성으로 하이브리드 할 수 있는 조건이 된다(가령, 완전히 일치하는 것과 한 개 염기가 미스메취(mismatch)된 하이브리드 반응을 식별할 수 있는 조건). 서열화될 핵산 또는 이의 중간 단편은 미리, 또는 그 다음에 또는 이와 동시에 제 2 프로브 세트에 제공한다. 표적상 인접 부위에 결합된 프로브는 함께 결합된다(가령, 겹쳐지는 작용 또는 리게이즈에 의해 또는 인접 프로브간에 화학적 결합 형성을 일으키는 수단에 의해). 인접 프로브가 결합되는 것을 허용한 후에, 제 1 프로브 세트 구성요소에 화학적 결합에 의해 표면에 고정되지 않는 단편 및 프로브는 고온(최고 100℃) 세척 용액을 이용하여 하이브리드를 용해하여 제거한다. 제 2 세트에 결합된 프로브는 이용된 라벨에 적합한 수단을 이용하여 감지할 수 있다(가령, 화학적 발광, 형광, 방사능활성, 효소, 밀도측정 또는 전기량 라벨).In the case of Format 3, a first set of oligonucleotide probes with known sequences is immobilized on a solid support under conditions such that the probes can hybridize to nucleic acids having respective complementary sequences. A second set of labeled origonucleotide probes is provided in solution. Between these sets and within the set are probes of the same length and probes of different lengths. The nucleic acid to be sequenced or an intermediate fragment thereof is provided to a first set of double stranded probes (particularly the portion with the recA protein that allows hybridization under undenatured conditions) or to a single stranded probe, wherein the conditions Is a condition that can hybridize with varying degrees of complementarity (eg, a condition that can identify a hybrid reaction that is a complete match and a mismatch of one base). The nucleic acid or intermediate fragment thereof to be sequenced is provided to the second probe set in advance, or following or concurrently. Probes bound to adjacent sites on the target are bound together (eg, by overlapping actions or ligase or by means of causing chemical bond formation between adjacent probes). After allowing adjacent probes to bind, fragments and probes that are not immobilized to the surface by chemical bonding to the first probe set component are dissolved by removing the hybrid using a high temperature (up to 100 ° C.) wash solution. Probes bound to the second set can be sensed using means appropriate to the label used (eg, chemiluminescence, fluorescence, radioactivity, enzymes, density measurements, or calorimetric labels).
여기에서, 특정 조건하에 수소결합에 의해 안정한 이중나선을 형성하는 경우에, 핵산 염기는 "짝을 이룸(match)" 또는 상보적이라고 한다. 가령, 하이브리드반응 검사에 통상적으로 이용되는 조건하에서, 아데닌("A")은 티민("T")과 짝을 이루지만, 구아닌("G") 또는 시토신("C")과는 짝을 이루지 않는다. 비슷하게, G는 C와 짝을 이루지만, A 또는 T와는 짝을 이루지 않는다. 특이성이 약한 방식으로 수소결합을 할 수 있는 다른 염기 가령, 이노신 또는 보편적인 염기("M" base, Nichols et al 1994) 또는 메틸화된 염기 등과 같은 다른 변형된 염기도 특정 조건하에서 안정한 이중나선을 형성하는 염기에 상보적이다. 프로브에 있는 각 염기가 Watson 및 Crick의 염기쌍 원칙에 따라 서열화될 핵산에 있는 염기에 수소결합을 하여 이중나선을 만드는 경우에 프로브는 "완전히 상보적" 또는 "완전하게 짝을 이룬다"라고 말한다(임의 주변 서열에 영향을 주지 않고, 형성된 이중 나선은 특정 프로브에 대해 최대 결합 에너지를 가짐). "완전하게 상보적인" 및 "완전하게 짝을 이룸"이란 의미에는 유사한 또는 변형된 뉴클레오티드를 가지는 프로브도 포함된다. 유사 또는 변형된 뉴클레오티드에 대해 "완전하게 짝을 이루었는지"는 유사체 또는 변형된 뉴클레오티드에 대해 선택된 "완전하게 짝을 이루는 원칙"에 따라 판단한다(예를 들면, 특정 유사 또는 변형된 뉴클레오티드에 대해 최대 결합 에너지를 가지는 결합쌍). "원칙"에 따라 결합쌍을 형성하지 않는 프로브내에 각 염기는 특정 하이브리드 조건하에서 짝을 잘못 이루었다 즉 "미스메취(mismatch)"라고 한다.Here, in the case of forming a stable double helix by hydrogen bonding under certain conditions, the nucleic acid bases are referred to as "match" or complementary. For example, under conditions commonly used for hybrid reaction testing, adenine ("A") pairs with thymine ("T") but not with guanine ("G") or cytosine ("C"). Do not. Similarly, G pairs with C, but not with A or T. Other modified bases, such as inosine or universal bases ("M" bases, Nichols et al 1994) or methylated bases, which are capable of hydrogen bonding in a weak specificity, may also form stable double helices under certain conditions. Complementary to base. When each base in a probe hydrogen bonds to a base in a nucleic acid to be sequenced according to Watson and Crick's base pairing principle to create a double helix, the probe is said to be "completely complementary" or "completely paired" (optional). Without affecting the surrounding sequence, the double helix formed has a maximum binding energy for a particular probe). The terms “fully complementary” and “fully paired” also include probes having similar or modified nucleotides. "Fairly paired" for similar or modified nucleotides is determined according to the "fully paired principle" selected for analogues or modified nucleotides (e.g., maximum for a particular similar or modified nucleotide). Binding pairs with binding energy). According to the “principle” each base in a probe that does not form a binding pair is mismatched under certain hybrid conditions, ie it is called a “mismatch”.
프로브 리스트를 조합하고 이때 각 프로브는 서열화될 핵산에 완전하게 짝을 이루는 것이다. 이들 리스트에 있는 프로브는 최대 겹쳐지는 방식으로 배열하여,이를 분석한다. 리스트에 있는 다른 프로브에 대해 제 1 프로브를 비교하여, 프로브에서 제 2 프로브의 5'단부에서 염기 서열과 동일한 염기의 최대 서열을 가지는 3'단부를 결정하여 순서를 결정한다. 제 1 프로브 및 제 2 프로브가 겹쳐지고, 남아있는 프로브의 3'단부에 대해 제 2 프로브의 5' 단부를 비교하고, 남아있는 프로브의 5'단부와 제 1 프로브의 3'단부를 비교하는 공정을 반복한다. 리스트상에 있는 프로브 중에 다른 프로브와 겹쳐지지 않는 프로브가 없을 때까지 이 공정을 반복한다. 또는, 양성 프로브 리스트중에 한 개 이상의 프로브를 선택하고, 겹챠지는 프로브 세트("서열 핵")를 나란하게 만든다. 각 서열 합체 공정에 각 프로브 리스트는 서열화될 핵산 또는 이의 일부에 완전하게 상보적인 모든 프로브 리스트가 된다.The probe list is combined, where each probe is completely paired with the nucleic acid to be sequenced. The probes in these lists are arranged in the maximum overlapping manner and analyzed. The order is determined by comparing the first probe to other probes in the list, determining the 3 'end with the maximum sequence of bases identical to the base sequence at the 5' end of the second probe in the probe. The first probe and the second probe overlap, and the 5 'end of the second probe is compared against the 3' end of the remaining probe, and the 5 'end of the remaining probe and the 3' end of the first probe are compared. Repeat. This process is repeated until none of the probes on the list overlap the other probe. Alternatively, one or more probes are selected from the list of positive probes, and the overlapping probe sets ("sequence nuclei") are side by side. Each probe list for each sequence merging process is a list of all probes that are completely complementary to the nucleic acid or portion thereof to be sequenced.
프로브의 5' 및 3' 말단이 겹쳐져 더 긴 서열 띠를 만든다. 분지점(프로브가 단편에서 반복됨), 프로브보다 더 긴 반복 서열 또는 클론안된 단편 때문에 모호성이 나타날 때까지 이와 같은 프로브 합체 공정을 반복한다. 임의 두 개 모호성사이에 있는 서열띠는 단편 또는 서브클론 서열(Sfs)이라고 한다. 프로브와 또 다른 프로브가 겹쳐질 가능성이 있기 때문에 서열 합체동안에 모호성이 나타나는데, 또다르게 겹쳐진 부분에 결치는 더 긴 프로브와 하이브리드, 경쟁적인 하이브리드, 모호한 부위에 결치는 프로브쌍의 말단에 또다른 말단의 결찰 또는 스그날 패스 겔 분석(Sfs의 명백한 순서를 제공)을 이용할 수 있다.The 5 'and 3' ends of the probe overlap to create a longer sequence band. This probe coalescing process is repeated until ambiguity appears due to branching points (probes are repeated in fragments), longer repeat sequences than probes or uncloned fragments. The sequence band between any two ambiguities is called a fragment or subclonal sequence (Sfs). Ambiguity occurs during sequence consolidation because of the possibility of overlapping probes with another probe, with longer probes missing in another overlapping part and longer ends of the probe pair missing in hybrids, competitive hybrids, or ambiguities. Ligation or signal pass gel analysis (provide a clear sequence of Sfs) can be used.
상기 과정을 이용함으로써, 합체된 Sfs를 이용한 겹쳐지는 또는 겹쳐지지 않는 프로브 또는 중간 단편 또는 전제 DNA 분자(가령 염색체)에 대한 하이브리드 패턴(이는 핵산 샘플을 확인하는 기호로 작용할 수 있는 핵산 샘플의 확인과 관련됨)에서 원하는 수준의 서열을 얻을 수 있다.By using the above process, hybrid patterns for overlapping or non-overlapping probes or intermediate fragments or whole DNA molecules (eg chromosomes) using coalesced Sfs can be used to identify nucleic acid samples that can serve as symbols to identify nucleic acid samples. Related) can be obtained at the desired level.
서열과 과정은 일반적으로 다음과 같은 단계로 구성된다;Sequences and processes generally consist of the following steps;
a) 핵산 단편이 상보적인 서열을 가지는 고정된 프로브와 1차 복합체를 형성할 수 있는 조건하에 핵산 단편과 고정된 올리고뉴클레오티드 프로브 배열을 접촉하고;a) contacting the nucleic acid fragment with the immobilized oligonucleotide probe sequence under conditions such that the nucleic acid fragment can form a primary complex with the immobilized probe having a complementary sequence;
b) 1차 복합체가 라벨된 프로브가 하이브리드될 수 있는데 효과적인 조건하에 라벨된 세트 올리고뉴클레오티드와 제 1 차 복합체를 접촉시키고, 따라서 제 2 복합체를 형성하고, 이때 단편은 고정된 프로브 및 라벨된 프로브와 하이브리드될 수 있고;b) probes labeled with the primary complex can hybridize, under effective conditions contacting the labeled set oligonucleotide with the primary complex, thus forming a second complex, wherein the fragments are combined with the immobilized probe and the labeled probe Can be hybridized;
c) 제 2 복합체로부터, 고정된 프로브에 인접한 하이브리드안된 임의 라벨된 프로브를 제거하고;c) removing from the second complex any unhybridized labeled probe adjacent the immobilized probe;
d) 라벨 존재를 감지함으로써 인접한 라벨된 프로브와 라벨 안된 프로브의 존재를 감지하고; 그리고d) detecting the presence of adjacent and unlabeled probes by sensing the presence of a label; And
e) 고정된 프로브와 라벨된 프로브의 공지 서열을 연결함으로써 단편의 뉴클레오티드 서열을 결정한다.e) The nucleotide sequence of the fragment is determined by linking the fixed probe with the known sequence of the labeled probe.
실제 완전하게 짝을 이룬 하이브리드를 감지하기 위해(단편 및 프로브는 7개중 6개 위치에 하이브리드된다), 완전하게 짝을 이루는 것과 한 개 염기가 미스메취(mismatch)를 이루는 것과 식별하기 위해, 또는 완전하게 짝을 이루는 하이브리드만을 감지하도록, 하이브리드 반응 및 세척 조건을 선택한다.To detect a true paired hybrid in practice (fragments and probes are hybridized to six of seven positions), to identify a complete pair and one base mismatch, or complete Hybrid reaction and wash conditions are selected to detect only hybrids that are well matched.
적절한 하이브리드 반응 조건은 과정을 최적화하거나 파일로트 연구를 이용하여 결정할 수 있다. 이와 같은 과정 및 연구는 당업자가 실험실에서 이용하는 프로토콜을 만들어 실행할 수 있다(Ausubel et al., Current Protocols in Molecular Biology, Vol. 1-2, John Wiley & Sons(1989); Sambrook et al., Molecular Cloning A Laboratory Manual, 2nd Ed., Vols. 1-3, Cold Springs Harbor Press(1989); Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Cold Spring Harbor, New York(1982)). 예를 들면, 온도, 성분 농도, 하이브리드 및 세척 시간, 완충액 성분 및 이의 pH 및 이온강도동의 조건을 다양하게 한다.Appropriate hybrid reaction conditions can be determined by optimizing the process or using pilot studies. Such procedures and studies can be made and implemented by protocols used by those skilled in the art (Ausubel et al., Current Protocols in Molecular Biology, Vol. 1-2, John Wiley & Sons (1989); Sambrook et al., Molecular Cloning A Laboratory Manual, 2nd Ed., Vols. 1-3, Cold Springs Harbor Press (1989); Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Cold Spring Harbor, New York (1982). For example, conditions of temperature, component concentration, hybrid and wash time, buffer components and their pH and ionic strength dynamics are varied.
라벨된 프로브 및 고정된 프로브를 물리적으로 또는 화학적으로 연결하지 않은 구체예에서, 스트리젼시가 조절된 세척 단계에서만 감지할 수 있다. 이와 같은 조건하에서, 인접 프로브간에 겹쳐지는 상호작용으로 인하여 인접 프로브간에 결합 친화력이 증가된다. 상기에서 설명하는 공정을 최적화하기 위해 조건을 다양하게 할 수 있다.In embodiments in which the labeled probes and the immobilized probes are not physically or chemically linked, the region may only be detected in a controlled washing step. Under these conditions, the binding affinity between adjacent probes is increased due to overlapping interactions between adjacent probes. Conditions may be varied to optimize the process described above.
고정된 프로브와 라벨된 프로브를 결찰시키는 구체예에서, 화학적 결찰 시약(예를 들면, 수용성 카르보디이미드 또는 시아노겐 브로마이드) 또는 리게이즈 효소 가령, 시판되는 T4DNA 리게이즈등을 이용하여 결찰시킬 수 있다. 인접한 프로브와 인접하지 않은 프로브에 안정성 차이를 나타내는 인접한 라벨된 프로브 및 고정된 프로브와 인접하지 않는 라벨된 프로브와 고정된 프로브를 식별하기 위해 세척 조건을 선택한다.In embodiments in which immobilized and labeled probes are ligated, they may be ligated using chemical ligation reagents (e.g., water soluble carbodiimide or cyanogen bromide) or a lease enzyme such as commercially available T 4 DNA ligase. Can be. Wash conditions are selected to identify adjacent labeled and immobilized and non-adjacent labeled and immobilized probes that exhibit stability differences between adjacent and non-adjacent probes.
올리고뉴클레오티드 프로브는 형광 염료, 화학적 발광 시스템, 방사능활성 라벨(가령,35S,3H,32P,33P) 또는 분광광도계로 감지할 수 있는 동위원소등으로 라벨할 수 있다.Oligonucleotide probes can be labeled with fluorescent dyes, chemiluminescent systems, radioactive labels (eg, 35 S, 3 H, 32 P, 33 P), or isotopes that can be detected with a spectrophotometer.
미지의 서열을 가지는 핵산 분자가 45 또는 50 bp이상인 경우에, 분자를 단편으로 만들어 단편의 서열을 결정한다. 단편으로 만드는 방법은 제한효소 처리, 전단 EH는 NaOH를 이용하면 된다. 10 내지 40bp 길이의 적절한 단편을 얻기 위해 단편은 크기에 따라 분리한다(전기영동).If the nucleic acid molecule having an unknown sequence is 45 or 50 bp or more, the molecule is fragmented to determine the sequence of the fragment. For fragmentation, restriction enzyme treatment and shear EH can be performed using NaOH. Fragments are separated according to size (electrophoresis) to obtain appropriate fragments 10 to 40 bp in length.
올리고뉴클레오티드는 당업자에 공지된 다수 방법을 이용하여 고정시킬 수 있는데, 예를 들면, 뉴클레오시드 포스포라미드(nucleoside phosphoramidite) 또는 뉴클레오시드 하이드로겐 포스포레이트(nucleoside hydrogen phosphorate)와 같은 시약을 이용하여 인산기를 통하여 레이져 광탈보호 부착 등의 방법을 이용한다. 유리, 나일론, 실리콘, 형광탄소 서포트등을 이용할 수 있다.Oligonucleotides can be immobilized using a number of methods known to those skilled in the art, for example using reagents such as nucleoside phosphoramidite or nucleoside hydrogen phosphorate. Using laser phosphate deprotection through a phosphate group. Glass, nylon, silicon, fluorescent carbon support can be used.
올리고뉴클레오티드를 배열시키고, 이들 배열에는 주어진 길이의 모든 프로브 또는 서브세트를 포함하거나 선택된 길이의 프로브 세트를 포함한다. 소수성 분리를 이용하여 프로브를 분리하거나 프로브 하위 배열을 분리한다. 다양한 용도(가령, 매핑, 부분 서열, 진단을 목적으로 표적 부분의 서열, mRNA 서열 및 대규모 서열화)에 사용할 수 있도록 한다. 기질 상에 프로브의 복합 및 배열을 선택하여 특정 용도에 이용할 수 있도록 특정 칩을 고안한다.Oligonucleotides are arranged and these arrays include all probes or subsets of a given length or include a probe set of a selected length. Hydrophobic separations are used to separate probes or probe subarrays. It can be used for a variety of uses (eg, mapping, subsequences, sequences of target moieties, mRNA sequences and large-scale sequencing for diagnostic purposes). Specific chips are designed to select a complex and array of probes on a substrate for use in a particular application.
예를 들면, 길이가 5염기인 올리고뉴클레오티드 프로브 전부를 1024개 고정된 프로브 배열(각 배열에는 1024개 별개 프로브를 포함함)로 만들 수 있다. 이 실시예에 있는 프로브는 정보제공의미에서는 5-mer이다(이들은 실제 더 긴 프로브일 수도 있다). 1024개 5-mer 프로브 제 2 세트를 라벨할 수 있고, 각 라벨된 프로브중 하나를 서열화할 단편과 함께 고정된 프로브 배열에 제공한다. 이 실시예에서, 1024 개 배열은 큰 "초배열(superarray)" 또는 "슈퍼칩(superchip)"에 복합된다. 고정된 프로브와 라벨된 프로브중 하나가 핵산 단편과 함께 단부-단부 하이브리드를 하는 경우에, 두 개 프로브는 결찰시켜 결합시키고, 결합 안된 라벨을 제거한 후에, 샘플 단편에 상보적인 10-mers는 공지 서열의 고정된 프로브에 공지 서열의 라벨된 프로브가 제공된 것을 가지는 배열에 라벨 존재로 인하여 감지된다. 샘플 단편의 서열은 간단하게 라벨된 프로브 서열에 연속하는 고정된 프로브의 서열이다. 이와 같은 방법으로, 일만개 가능한 10-mers는 5-mers만을 이용하고, 올리고뉴클레오티드 합성에 대해 수천만 가지 노력이 필요한 복합 공정으로 테스트한다.For example, all of the five base oligonucleotide probes can be made into 1024 fixed probe arrays, each comprising 1024 separate probes. The probes in this embodiment are 5-mers for informational purposes (these may actually be longer probes). A second set of 1024 5-mer probes can be labeled and one of each labeled probe is provided in a fixed probe array with fragments to be sequenced. In this embodiment, 1024 arrays are composited into a large "superarray" or "superchip". If one of the immobilized and labeled probes is end-end hybrid with the nucleic acid fragment, the two probes are ligated to bind, and after removal of the unbound label, the 10-mers complementary to the sample fragment are known sequences. Detected due to the presence of a label in an array having a fixed probe of provided with a labeled probe of known sequence. The sequence of the sample fragment is simply the sequence of the immobilized probe that is continuous to the labeled probe sequence. In this way, 10,000 possible 10-mers are tested in a complex process that uses only 5-mers and requires tens of millions of efforts for oligonucleotide synthesis.
적절한 구체예에서, 올리고뉴클레오티드 프로브의 배열을 서포트할 기질은 섹션으로 분할하여, 배열에 있는 각 프로브가 소수성 물질로 만들어진 물리적인 장벽에 의해 인접 프로브와 분리된다. 적절한 구체예에서, 물리적인 장벽의 폭은 100㎛ 내지 30㎛이다. 좀더 적절한 구체예에서, 각 프로브의 중심에서 인접한 임의 프로브 중심까지의 거리는 325㎛이다. 프로브 배열은 잉크-젯 침착 장치를 이용하여 회전 드럼 또는 플레이트에 고정된 움직이지 않는 고정 기질을 이용하여 "대량 생산"되는데, 잉크 젯 장치로는 가령, 마이크로 드롭 도징 헤드, 적절한 로봇 시스템, 안라드 간트리(anorad gantry)등이 있다.In a suitable embodiment, the substrate that will support the array of oligonucleotide probes is divided into sections so that each probe in the array is separated from adjacent probes by a physical barrier made of hydrophobic material. In suitable embodiments, the physical barrier has a width of 100 μm to 30 μm. In a more suitable embodiment, the distance from the center of each probe to any adjacent probe center is 325 μm. The probe array is "mass produced" using a stationary fixed substrate fixed to a rotating drum or plate using an ink-jet deposition apparatus, which may include, for example, a micro drop dosing head, a suitable robotic system, anrad. And ananorad gantry.
또 다른 적절한 구체예에서, 올리고뉴클레오티드 프로브는 3차원 배열에 고정된다. 3차원 배열은 다수의 층으로 구성되고, 각 층은 다른 층과는 떨어져 있고, 별도로 분석된다. 3차원 배열은 여러 가지 형태를 취하는데, 예를 들면, 배열은 디프레션내에 상이한 깊이로 위치한 프로브와 다중 디프레션을 가지는 기질에 배치된다(각 수준은 디프레션내에 유사한 깊이를 가지는 기질에 배치된다) 또는 배열은 디프레션 바닥에 또는 디프세션을 분리하는 피크에 또는 피크 및 디프레션이 복합된 위치한 프로브와 상이한 깊이의 디프레션을 가지는 기질에 배치된다; 또는 3차원 배열을 만들기위해 층을 이룬 다중 쉬트로 구성된 기질에 배치된다.In another suitable embodiment, the oligonucleotide probe is immobilized in a three dimensional array. The three-dimensional array consists of a plurality of layers, each layer separated from the other layers and analyzed separately. Three-dimensional arrays take many forms, for example, the array is placed on a substrate having multiple depressions and probes located at different depths in the depression (each level is placed on a substrate having a similar depth in the depression) or arrangement Is placed at the bottom of the depression or at a peak that separates the depression or on a substrate having a depth of depression different from the located probe where the peak and depression are combined; Or placed on a substrate composed of multiple layers layered to create a three-dimensional array.
이와 같은 배열에서 프로브에는 기질의 표면과 프로브의 정보 부분 사이의 거리를 증가시키는 스페이스를 포함한다. 스페이스는 탄소, 실리콘, 황, 인산등과 같은 적어도 2개의 공유 결합을 이루는 원자로 구성되거나 당-인산염 기, 아미노산, 단백질, 뉴클레오시드, 뉴클레오티드, 당, 탄수화물, 방향족 고리, 탄화수소 고리, 선형 및 분지쇄 형 탄화수소등과 같은 적어도 2개의 공유 결합을 이루는 분자로 구성된다.In such an arrangement, the probe includes a space that increases the distance between the surface of the substrate and the information portion of the probe. Spaces consist of at least two covalent atoms, such as carbon, silicon, sulfur, phosphoric acid, or sugar-phosphate groups, amino acids, proteins, nucleosides, nucleotides, sugars, carbohydrates, aromatic rings, hydrocarbon rings, linear and branched It consists of molecules that form at least two covalent bonds, such as chain hydrocarbons.
서열화할 핵산 샘플을 단편으로 만들거나 샘플에 2차 구조로 인하여 하이브리드반응이 방해되지 않도록 처리한다(예를 들면, recA를 이용). 샘플은 Cvi JI와 같은 제한 효소로 처리, 전단(초음파분쇄), NaOH 처리 등의 방법으로 단편화시킬 수 있다. 생성된 단편은 겔 전기영동에 의해 분리하고, 10bp 내지 40bp 길이의 단편을 겔로부터 추출한다. 적절한 구체예에서, 핵산 샘플의 "단편"은 풀에서 다른 단편과는 결찰되지 않는다. 이와 같은 단편 물은 분별된 핵산을 포스포타제(가령, 송아지 내장 포스포타제)로 처리하여 수득할 수 있다. 또는, 샘플 핵산의 비-결찰된 단편은 샘플 핵산의 Sanger-양대툐 서열화 반응에서 무작위 프라이머(e.g., N5-N9, 이때 N = A. G. T. or C)를 이용하여 수득할 수 있다. 이로써 표적 핵산에 상보적인 서열을 가지는 DNA 단편을 만들고, 다른 단편에 결찰안된 디데옥시 잔기에서 종료된다.The nucleic acid sample to be sequenced is fragmented or treated to prevent the hybridization from interfering with the secondary structure (eg, using recA). Samples can be fragmented by treatment with a restriction enzyme such as Cvi JI, shear (ultrasound grinding), NaOH treatment, and the like. The resulting fragments are separated by gel electrophoresis and 10 bp to 40 bp long fragments are extracted from the gel. In suitable embodiments, "fragments" of nucleic acid samples are not ligated with other fragments in the pool. Such fragments can be obtained by treating fractionated nucleic acids with phosphatase (eg, calf visceral phosphatase). Alternatively, non-ligated fragments of sample nucleic acids can be obtained using random primers (eg, N 5 -N 9 , where N = AGT or C) in the Sanger-versus sequencing reaction of the sample nucleic acid. This creates a DNA fragment having a sequence complementary to the target nucleic acid and terminates at the dideoxy residue not ligated to the other fragment.
재사용할 수 있는 Fromat 3 SBH 배열은 고정된 프로브와 라벨된 프로브간에 절단할 수 있는 결합을 도입하여 만드는데, Format 3 분석이 끝난 후에 이 결합이 절단되면 종료된다. 라벨된 프로브는 리보뉴클레오티드가 될 수 있는데, 이를 이용하여 라벨된 프로브에 염기를 결합시키고, 이 프로브는 RNAse 또는 우라실-DNA-글리코실레이트 처리 또는 NaOH 처리에 의해 제거한다. 또한, 화학적 결찰에 의해 형성된 결합은 선택적으로 절단할 수 있다.The reusable Fromat 3 SBH array is created by introducing a cleavable bond between the fixed and labeled probes, which is terminated when the bond is cleaved after Format 3 analysis. The labeled probe can be a ribonucleotide, which is used to bind a base to the labeled probe, which is removed by RNAse or uracil-DNA-glycosylation treatment or NaOH treatment. In addition, bonds formed by chemical ligation can be selectively cleaved.
다른 변수로는 특이성 또는 효과를 증가시키기 위해 변형된 올리고뉴클레오티드 이용, 하이브리드 시그날을 증가시키기 위해, 사이클링 하이브리드를 이용 가령, 라벨된 제 1 프로브 세트에 대해 선택된 조건에 이어, 제 2 라벨된 프로브 세트에 적절한 조건하에 하이브리드 반응을 사이클로 실시하면 된다. 각 네 개 뉴클레오티드 염기 A, T, C, G 각각에 프로브 혼합물(적절하게는 동일한 몰량 혼합물)을 이용하여 리딩 프레임의 이동을 감지할 수 있다.Other variables include using modified oligonucleotides to increase specificity or effect, using a cycling hybrid to increase hybrid signal, e.g., following conditions selected for the first set of labeled probes, followed by a second set of labeled probes. What is necessary is just to perform a hybrid reaction in cycles under suitable conditions. Probe mixture (appropriately the same molar amount mixture) for each of the four nucleotide bases A, T, C, and G can be used to detect the shift of the reading frame.
단편의 순서에 따른 서열화에 분지점은 모호함을 일으킨다. 서열 정보는 SBH로 결정되지만, (i) 완전한 겔 서열화 비용을 나누기 위해, 긴 판독 길이, 단일 통과 겔 서열화; 또는 (ii) 관련 서열을 비교함으로써, 이와 같은 모호함(분지점)이 있는 하이브리드 데이터 순서를 정한다. 분지점을 통한 단일 패스 겔 서열화를 위한 프라이머는 SBH 서열 정보 또는 동지의 벡터 서열로부터 확인할 수 있는데, 샘플 핵산에서 벡터 삽입 부위에 인접 서열, 표준 Sanger-서열 반응을 실행한다. 이와 같은 단일 패스 겔 서열화에서 수득한 서열은 분지점안팍을 판독하는 Sfs와 비교하여, Sfs 순서를 확인한다. 또는, Sfs 서열과 관련 서열을 비교하고, Sfs 순서를 정하여, 관련 서열에 가장 근접한 서열을 만들어서 Sfs 서열을 정한다. 또한, 표적 단편에 있는 나란한 반복되는 핵산 단편 수는 단일 패스 겔 서열화를 이용하여 결정한다. 나란한 반복체는 단백질을 인코드하는 유전자 부분에서는 드물게 발생하기 때문에, 비-코딩 부분이 특정 관심이 있는 것(가령, 중요한 조절 서열인 경우)으로 확인된 경우에만 겔-서열화 단계를 실행한다.Branch points cause ambiguity in the ordering of fragments. Sequence information is determined by SBH, but (i) long read length, single pass gel sequencing to divide complete gel sequencing cost; Or (ii) comparing the relevant sequences to order hybrid data with this ambiguity (branch point). Primers for single pass gel sequencing through branch points can be identified from the SBH sequence information or from the same vector sequence, which performs a contiguous sequence, standard Sanger-sequence reaction, at the vector insertion site in the sample nucleic acid. The sequence obtained in this single pass gel sequencing is compared to Sfs, which reads inside branches, to confirm the Sfs sequence. Alternatively, the Sfs sequence is determined by comparing the Sfs sequence with the related sequence, ordering the Sfs, and making the sequence closest to the related sequence. In addition, the number of side-by-side repeating nucleic acid fragments in the target fragment is determined using single pass gel sequencing. Side-by-side repeats occur rarely in the portion of the gene encoding the protein, so the gel-sequencing step is performed only when the non-coding portion is identified as being of particular interest (eg, if it is an important regulatory sequence).
약 200개 올리고뉴클레오티드 프로브에 대해 나타난 하이브리드 반응 정도에 대해 수득된 정보는 각 유전자의 독특한 신호로, 이를 이용하여 라이브러리로부터 cDNA를 분류하여, 라이브러리에 동일한 유전자가 다수 복사되어 있는지를 결정한다. 이와 같은 신호에 의해 동일한, 유사한 또는 상이한 cDNA를 식별하고, 조사할 수 있다.The information obtained about the degree of hybrid reaction seen for about 200 oligonucleotide probes is a unique signal for each gene, which is used to classify cDNA from the library to determine if there are multiple copies of the same gene in the library. Such signals can identify and examine the same, similar or different cDNAs.
핵산 및 핵산을 분리하고, 클로닝하고, 서열화하는 방법은 당분야에 공지되어 있다(Ausubel et al., Current Protocols in Molecular Biology, Vol. 1-2, John Wiley & Sons(1989); and Sambrook et al., Molecular Cloning A Laboratory Manual, 2nd Ed., Vols. 1-3, Cold Springs Harbor Press (1989)).Methods of isolating, cloning and sequencing nucleic acids and nucleic acids are known in the art (Ausubel et al., Current Protocols in Molecular Biology, Vol. 1-2, John Wiley & Sons (1989); and Sambrook et al. , Molecular Cloning A Laboratory Manual, 2nd Ed., Vols. 1-3, Cold Springs Harbor Press (1989)).
SBH는 당분야에 공지된 여러 방법으로 실행할 수 있는 잘 개발된 기술이다. 특히, 다음의 문헌에 기술된 하이브리드를 이용한 서열화에 관련된 기술을 소개한다; Drmanac et 의 미국 특허 5,202,231-1993년 4월 13일자로 특허됨; Drmanac et al., Genomics, 4, 114-128(1989); Drmanac et al., Proceeding of the First Int'l. Conf. Electrophoresis Supercomputing Human Genome Cantor et al., eds, World Scientific Pub. Co., Singapore, 47-59 (1991); Drmanac et al., Science, 260, 1649-1652 (1993); Lehrach et al., Genome Analysis: Genetic and Physical Mapping, 1, 39-81 (1990), Cold Res., 4691 (1986); Stevanovic et al., Gene, 79, 139 (1989); Panusku et al., Mol. Biol. Evol., 1, 607 (1990); Nizetic et al., Nucl. Acids Res., 19, 182 (1991); Drmanac et al., J. Biomol. Struct. Dyn., 5, 1085 (1991); Hoheisel et al., Mol. Gen., 4, 125-132 (1991); Strezoska et al., Proc. Nat'l. Acad. Sci. (USA), 88, 10089 (1991); Drmanac et al., Nucl. Acids. Res., 19, 5839 (199); and Drmanac et al., Int. J. Genome Res., 1, 59-79 (1992)).SBH is a well developed technique that can be implemented in a variety of ways known in the art. In particular, we introduce techniques related to sequencing with hybrids described in the following references; United States Patent No. 5,202,231-1993 to Drmanac et. Drmanac et al., Genomics, 4, 114-128 (1989); Drmanac et al., Proceeding of the First Int'l. Conf. Electrophoresis Supercomputing Human Genome Cantor et al., Eds, World Scientific Pub. Co., Singapore, 47-59 (1991); Drmanac et al., Science, 260, 1649-1652 (1993); Lehrach et al., Genome Analysis: Genetic and Physical Mapping, 1, 39-81 (1990), Cold Res., 4691 (1986); Stevanovic et al., Gene, 79, 139 (1989); Panusku et al., Mol. Biol. Evol., 1, 607 (1990); Nizetic et al., Nucl. Acids Res., 19, 182 (1991); Drmanac et al., J. Biomol. Struct. Dyn., 5, 1085 (1991); Hoheisel et al., Mol. Gen., 4, 125-132 (1991); Strezoska et al., Proc. Nat'l. Acad. Sci. (USA), 88, 10089 (1991); Drmanac et al., Nucl. Acids. Res., 19, 5839 (199); and Drmanac et al., Int. J. Genome Res., 1, 59-79 (1992)).
본 발명은 다음의 실시예를 통하여 설명한다. 본 발명에서 설명하는 내용을 참고하면, 당업자는 본 발명 범위내에서 다른 구체예 및 변화를 만들 수 있을 것이다. 따라서, 다음 실시예에 본 발명의 범위를 한정하지는 않는다.The invention is illustrated by the following examples. With reference to the content described in the present invention, those skilled in the art will be able to make other embodiments and variations within the scope of the present invention. Therefore, the scope of the present invention is not limited to the following examples.
실시예 1 ; 프로브 세트의 준비Example 1; Preparation of Probe Sets
두 가지 보편적인 프로브 세트를 준비한다. 처음 세트는 상대적으로 짧은 프로브 완전한 세트 예를 들면, 4096개(또는 200개 비-상보적인) 6-mer 또는 16,384개(또는 8,000개 비-상보적인) 7-mers이다. 8-mers의 완전하게 비상보적인 서브세트 또는 더 긴 프로브는 32,000개 이상의 프로브를 포함하고 있기 때문에 불편하다.Prepare two universal probe sets. The first set is a relatively short probe complete set, for example, 4096 (or 200 non-complementary) 6-mers or 16,384 (or 8,000 non-complementary) 7-mers. Completely non-complementary subsets of 8-mers or longer probes are inconvenient because they contain more than 32,000 probes.
작은 서브세트 프로브로 적어도 한 개 프로브로 임의 서열에 모든 bp를 판독하는데 충분하기 때문에 제 2 형태의 프로브 세트를 선택한다. 예를 들면, 16mer중 12개 정도면 충분하다. 이중 나선 DNA를 서열화하는데 7-mers, 8-mer, 9-mers의 경우 서브세트는 각각 약 3000개, 10,000개, 30,000개 프로브가 된다.The second set of probe sets is chosen because a small subset of probes is sufficient to read all bp in any sequence with at least one probe. For example, 12 out of 16 mer is sufficient. For sequencing double helix DNA, for the 7-mers, 8-mers, and 9-mers, the subset would be about 3000, 10,000, and 30,000 probes, respectively.
프로브 세트는 공지의 서열을 가지는 표적 핵산을 확인하고, 공지 서열을 가진 표적 핵산의 대립형질 또는 돌연변이를 확인하기 위해 선택한다. 이와 같은 프로브 세트에는 적어도 한번은 표적 핵산의 모든 뉴클레오티드 위치가 판독될 수 있도록 충분한 양의 프로브를 포함한다. "양성" 프로브의 한 개 결합을 상실하게 되는 경우에 대립형질 또는 돌연변이를 확인할 수 있다. 이들 대립형질 또는 돌연변이의 특정 서열은 모든 가능한 뉴클레오티드 변화를 포함하고, 이들 프로브 위치에서 이들 변화가 복합된 것을 포함하는 프로브 세트로 표적 핵산을 조사하여 결정한다.The probe set is selected to identify target nucleic acids having known sequences and to identify alleles or mutations of target nucleic acids having known sequences. Such probe sets include a sufficient amount of probes so that at least once all the nucleotide positions of the target nucleic acid can be read. Alleles or mutations can be identified when one binding of a "positive" probe is lost. The specific sequence of these alleles or mutations includes all possible nucleotide changes, and is determined by examining the target nucleic acid with a set of probes comprising a combination of these changes at these probe positions.
프로브 세트는 30개 프로브 내지 유니버셜 프로브 세트(특정 길이의 전체 프로브)로 구성되고, 좀더 적절하게는 세트는 100-500개 프로브로 구성되고, 가장 적절한 구체예에서, 프로브는 300개 프로브 세트를 포함한다. 적절한 구체예에서, 프로브 세트는 길이가 6-9개 뉴클레오티드가 되고, 이를 이용하여 유사한 동일한 서열을 가지는 집단으로 cDNA 클론을 모으고, 단일 클론은 서열화를 위해 각 군에서 선택된다.The probe set consists of 30 probes to a universal probe set (all probes of a specific length), more suitably the set consists of 100-500 probes, and in the most suitable embodiment, the probe comprises 300 probe sets do. In a suitable embodiment, the probe set is 6-9 nucleotides in length, using which the cDNA clones are grouped into populations with similar identical sequences, and a single clone is selected from each group for sequencing.
단부에 1 내지 3개의 비-특정 염기(가령, A, T, C가 혼합된 경우) 또는 보편적인 염기(가령, M염기 또는 이노신)을 이용한 표준 화학을 이용하여 프로브를 만든다. 방사능라벨링을 이용하는 경우에, 방사능라벨된 인산기를 붙이기 위해 5' 말단에 OH기를 가진다. 또는 임의 적합한 시스템으로 라벨된 프로브 가령, 형광 염료등을 이용할 수 있다. PNA(Protein Nucleic Acids)와 같은 다른 형태의 프로브 또는 이중나선의 안정성을 변화시킬 수 있는 변형된 염기를 포함하는 프로브를 이용할 수 있다.Probes are made using standard chemistry with one to three non-specific bases (eg, A, T, C mixed) or universal bases (eg, M base or inosine) at the ends. When using radiolabeling, it has an OH group at the 5 'end to attach a radiolabeled phosphate group. Or probes labeled with any suitable system such as fluorescent dyes and the like. Other types of probes such as Protein Nucleic Acids (PNA) or probes containing modified bases that can change the stability of the double helix can be used.
프로브는 바코드가 있는 다중 웰 플레이트에 보관한다. 소수의 프로브 경우에, 96웰 플레이트를 이용할 수 있다; 가령, 10,000 또는 그 이상의 프로브의 경우에, 384 또는 864-웰 플레이트에 저장하는 것이 바람직하다. 5 내지 50개 플레이트를 겹쳐놓으면 모든 프로브를 저장할 수 있다. 약 5ng 프로브 정도면 한 개 DNA 샘플을 하이브리드하는데 충분하다. 따라서, 프로브당 약 50㎎을 합성할 수 있기 때문에, 천만개 샘플을 분석할 수 있다. 각 프로브를 매번 세 번째 샘플에 이용할 경우에, 각 샘플의 길이가 1000bp인 경우에, 5,000개 프로브 세트로 300억개 염기(10개 사람 게놈)을 서열화할 수 있다.Probes are stored in multi-well plates with barcodes. For a few probes, 96 well plates can be used; For example, for 10,000 or more probes, it is desirable to store in 384 or 864-well plates. By stacking 5-50 plates, all probes can be stored. About 5ng of probe is enough to hybridize one DNA sample. Thus, about 50 mg per probe can be synthesized, thus analyzing 10 million samples. When each probe is used for the third sample each time, if each sample is 1000 bp in length, it is possible to sequence 30 billion bases (10 human genomes) with 5,000 probe sets.
실시예 2 ; 변형된 올리고뉴클레오티드를 가지는 프로브Example 2; Probes with Modified Oligonucleotides
변형된 올리고뉴클레오티드를 하이브리드 프로브에 도입하고, 이를 적절한 조건하에 둔다. 가령, C5-위치에 할로겐 피리미딘을 이용하여 염기의 스태킹(stacking)에 영향을 주어 이중 나선의 안정성을 개선시킨다. 2,6-디아미노퓨린을 이용하여, 티민과 염기쌍을 이루는데 있어서 제 3 수소 결합을 제공하여, DNA-이중나선을 열적으로 안정화시킨다. 2,5-디아미노퓨린을 이용하면, 이중나선의 안정성을 증가시켜, 어닐링을 위해 좀더 엄격한 조건을 제공하고, 배경 문제를 억제하여, 더 짧은 올리고머를 이용할 수 있다.The modified oligonucleotides are introduced into the hybrid probes and placed under appropriate conditions. For example, the use of halogen pyrimidines at the C 5 -position affects the stacking of bases to improve the stability of the double helix. 2,6-diaminopurine is used to provide a third hydrogen bond in base pairing with thymine to thermally stabilize the DNA-double helix. With 2,5-diaminopurine, shorter oligomers can be used by increasing the stability of the double helix, providing more stringent conditions for annealing and suppressing background problems.
이와 같이 변형된 3인산 뉴클레오티드 합성에 대해서는 Hoheisel & Lehrach (1990)에 설명한다.The modified triphosphate nucleotide synthesis is described in Hoheisel & Lehrach (1990).
Nichols et al. (1994)에서 설명하는 것과 같이 식별이 되지 않는 염기 유사체 또는 보편적인 염기를 이용할 수 있다. 이와 같은 새로운 유사체인, 1-(2-데옥시-D-리브퓨라노실)-3-니트로피롤("M"으로 지정)을 만들어 올리고뉴클레오티드 프로브 및 유전자 코드의 축중성으로 인하여 발생되는 디자인 문제를 해결하기 위한 프라이머로 이용하거나 또는 단편적인 펩티드 서열 데이터만을 이용할 수 있을 경우에 사용한다. 이와 같은 유사체는 스태킹을 최대로 하고 DNA 이중나선의 공간적인 간섭을 파괴하지 않으면서 수소-결합 상호작용을 최소화한다.Nichols et al. As described in (1994), non-identified base analogs or universal bases can be used. Design of this new analogue, 1- (2-deoxy-D-ribfuranosyl) -3-nitropyrrole (designated as "M") resulting from degeneracy of oligonucleotide probes and genetic code It is used as a primer to solve a problem or when only fragment peptide sequence data is available. Such analogs maximize stacking and minimize hydrogen-bonding interactions without disrupting the spatial interference of the DNA double helix.
M 뉴클레오시드 유사체는 이형방향족 고리에 연결된 비 양자성 극성 치환제를 이용하여 스태킹 상호작용을 최대화하고, 가닥 내에 그리고 가닥간에 스태킹 상호작용을 강화시켜 염기쌍 특이성에서 수소 결합의 역할을 줄인다. Nichols et al. (1994)는 3-니트로피롤 2-데옥시리보뉴클레오시드를 선호하였는데, 그 이유는 p-니트로아닐린에 구조적으로 그리고 전자적으로 유사하기 때문이다. 이 유도체는 이중가닥 DNA의 최소 인터칼터(intercaltor)중에 하나이다.M nucleoside analogs utilize non-protonous polar substituents linked to heteroaromatic rings to maximize stacking interactions and enhance the stacking interactions within and between strands to reduce the role of hydrogen bonding in base pair specificity. Nichols et al. (1994) preferred 3-nitropyrrole 2-deoxyribonucleoside because it is structurally and electronically similar to p-nitroaniline. This derivative is one of the minimum intercaltors of double stranded DNA.
서열화 및 폴리메라제 사슬 연쇄 반응(PCR)을 위한 프라이머로 이용되는 뉴클레오티드에 결합되는데 디메틸옥시트리틸-보호된 뉴클레오시드 M 포스포라미디트를 이용할 수 있다. Nichols et al. (1994)는 프라이머 특이성에 손상을 받지 않고 실제 수의 뉴클레오티드가 M으로 대체된다.Dimethyloxytrityl-protected nucleoside M phosphoramidites can be used to bind nucleotides used as primers for sequencing and polymerase chain chain reaction (PCR). Nichols et al. (1994) replaces the actual number of nucleotides with M without compromising primer specificity.
M의 독특한 성질은 연속 뉴클레오시드를 대체하면서, 기능을 가지는 서열 프로브를 만들 수 있다는 것이다. 3개, 6개, 9개 M을 이용하여 서열화할 경우에, 판독할 수 있는 서열화 사다리를 제공하고, 세 가지 다른 M-을 포함하는 프라이머를 이용하여 PCR을 하는 경우에 정확하게 생성물이 증폭된다(Nichols et a., (1994).The unique property of M is that it is possible to make functional sequence probes, replacing continuous nucleosides. When sequencing with 3, 6, and 9 M, a readable sequencing ladder is provided and the product is amplified correctly when PCR is performed using primers containing three different M- ( Nichols et a., (1994).
프라이머로 기능을 하는 3-니트로피롤을 포함하는 올리고뉴클레오티드의 능력은 이중 나선 구조가 상보적인 가닥을 형성한다는 것을 말한다. 올리고뉴클레오티드 쌍 d(5 -C2-T5XT5G2-3), d(5 -C2A5YA5G2-3)(이때, X와 Y는 A, C, G, T, M이다)에서 수득된 광학적 열 프로파일은 DNA 이중 가닥이 단일 가닥으로 전이된 경우에 나타나는 정상적인 신호 패턴에 일치한다는 보고가 있다. X M 염기쌍(이때 X는 A, C, G, T이고, Y는 M이다)을 포함하는 올리고뉴클레오티드의 Tm 값이 모두 3℃ 범위에 속한다고 보고된 바 있다(Nichols et al., 1994).The ability of oligonucleotides to comprise 3-nitropyrrole to function as a primer means that the double helix structure forms a complementary strand. Oligonucleotide pair d (5-C 2 -T 5 XT 5 G 2 -3), d (5-C 2 A 5 YA 5 G2-3), where X and Y are A, C, G, T, M It is reported that the optical thermal profile obtained in Fig. 3 corresponds to the normal signal pattern that appears when the DNA double strand is transferred to a single strand. It has been reported that the Tm values of oligonucleotides containing XM base pairs where X is A, C, G, T and Y are M are all in the 3 ° C. range (Nichols et al., 1994).
실시예 3 ; 프로브의 선택 및 라벨링Example 3; Probe Selection and Labeling
서브배열을 만들 경우에, 각 서브배열에서 하이브리드 과정 각각에서 하이브리드되는 프로브 세트로 한정한다. 가령, 384개 프로브 세트는 보편적인 세트로부터 선택되고, 4개 과정 각각에서 96개 프로브가 실행된다. 한 개 과정에서 하이브리드되는데 선택된 프로브는 유사한 G+C 함량을 가진다.When creating subarrays, limit each probe array to a set of probes that are hybridized in each of the hybrid processes. For example, 384 probe sets are selected from the universal set, and 96 probes are run in each of the 4 procedures. The probe selected to hybridize in one process has a similar G + C content.
각 과정에 대해 선택된 프로브는 96웰 플레이트로 옮겨지고, 그 다음 카이네이즈 또는 다른 라벨링 과정에 의해 라벨한다(사용하기 전에 라벨되어 있지 않는 경우 가령 안정한 형광염료로 라벨되지 않은 경우).The probe selected for each procedure is transferred to a 96 well plate and then labeled by kinase or other labeling procedure (unless labeled before use, for example if it is not labeled with a stable fluorescent dye).
제 1 라운드 하이브리드과정에 기초하여, 추가 과정을 위해 각 서브배열에 새로운 세트의 프로브를 할당한다. 일부 배열은 일부 과정에서는 사용되지 않는다. 예를 들면, 64명 환자 샘플중 8개만이 돌연변이를 나타내면, 8개 프로브를 각 돌연변이에 우선 기입하고, 64개 모든 프로브를 한 과정에 기록하고 32개 서브배열은 이용하지 않는다. 이와 같이 이용 안된 서브배열은 그 다음 하이브리드 완충액으로 처리하여, 필터의 건조를 방지한다.Based on the first round hybrid procedure, a new set of probes is assigned to each subarray for further processing. Some arrays are not used in some processes. For example, if only eight of the 64 patient samples show mutations, eight probes are first written to each mutation, all 64 probes are recorded in one procedure and 32 subarrays are not used. This unused subarray is then treated with a hybrid buffer to prevent drying of the filter.
임의 통상적인 방법으로 저장 플레이트로부터 프로브를 회수할 수 있는데, 이와 같은 방법을 예로 들면, 단일 채널 피펫팅 장치, Beckman Biomek 1000(Beckman Instruments, Fullerton, California)과 같은 로봇 스테이션 또는 Mega Two robot(Megamation, Lawrenceville, New Jersey)등이 있다. 로봇 스테이션에는 데이터 분석 프로그램 및 프로브 조절 프로그램이 포함된다. 이들 프로그램의 결과를 한 개이상의 로봇 스테이션에 입력한다.The probe may be recovered from the storage plate in any conventional manner, such as, for example, a single channel pipetting device, a robot station such as Beckman Biomek 1000 (Beckman Instruments, Fullerton, California) or a Mega Two robot (Megamation, Lawrenceville, New Jersey). The robot station includes a data analysis program and a probe adjustment program. The results of these programs are entered into one or more robot stations.
프로브는 한 개씩 회수하고, 하이브리드 완충액으로 덮인 서브배열에 첨가한다. 회수된 프로브는 새로운 플레이트에 위치하여 하이브리드 완충액으로 혼합하거나 라벨링하는 것이 바람직하다. 적절한 회수 방법은 한 개씩 저장된 플레이트에 접근하여 각 플레이트로부터 충분한 양의 각 선택된 프로브를 중간 플레이트의 특정 웰로 피펫팅한다(또는 금속 핀을 이용하여 옮기고). 개별 피펫 또는 핀 배열을 이용하여 회수 공정을 가속하는데 이용한다.The probes are collected one by one and added to the subarray covered with hybrid buffer. The recovered probe is preferably placed in a new plate to mix or label with hybrid buffer. Appropriate recovery methods access plates stored one by one and pipet (or transfer using metal pins) a sufficient amount of each selected probe from each plate to a particular well of the intermediate plate. Individual pipettes or pin arrays are used to accelerate the recovery process.
실시예 4 ; 라벨된 프로브 준비Example 4; Labeled Probe Preparation
당분야에 일상적인 공지 자동 합성에 의해 올리고뉴클레오티드 프로브를 준비하는데 예를 들면, Biosystem system을 이용한다. 또는 Genosys Biotechnologies Inc.의 다공성 테플론 웨이퍼를 이용한 스택 방법을 이용하여 프로브를 준비한다.For example, a Biosystem system is used to prepare oligonucleotide probes by automatic synthesis, routinely known in the art. Alternatively, the probe may be prepared using a stacking method using a porous Teflon wafer of Genosys Biotechnologies Inc.
100-200㎛ 또는 100-400㎛ 스팟 배열의 경우에 올리고뉴클레오티드 프로브는 방사능라벨(예를 들면,35S,32P,33P, 적절하게는33P)로 하거나; 또는 비-방사능활성 동위원소(Jacobsen et al., 1990)로 라벨하거나 또는 형광단(Brumbaugh et al., 1988)을 이용하여 라벨링한다. 이와 같은 라벨링은 당분야에서 일상적인 것으로 관련 내영은 Sambrook et al. (1989) 또는 Schubert et al. (1990), Murakami et al. (1991), Cate et al. (1991)등이 기술하고 있다.For 100-200 μm or 100-400 μm spot arrays the oligonucleotide probes are radiolabeled (eg 35 S, 32 P, 33 P, suitably 33 P); Or a non-radioactive isotope (Jacobsen et al., 1990) or a fluorophore (Brumbaugh et al., 1988). Such labeling is routine in the art and related implications are described in Sambrook et al. (1989) or Schubert et al. (1990), Murakami et al. (1991), Cate et al. (1991) et al.
방사능라벨링에 관계하여, 통상적인 방법은 T4 폴리뉴클레오티드 카이나제를 이용하여 단부-라벨링을 하거나 Klenow 또는 T7 중합효소를 이용하여 높은 특이 활성을 가지는 라벨링을 할 수 있다. 이는 다음에서 설명한다.Regarding radiolabeling, conventional methods can be end-labeled using T4 polynucleotide kinase or labeled with high specific activity using Klenow or T7 polymerase. This is explained in the following.
5 말단에 인산기 없이 합성 올리고뉴클레오티드를 합성하여, 효소 박테리오파아지 T4 폴리뉴클레오티드 카이나제를 이용하여 -32p를 전달하거나 [-32P]ATP 또는 [-33P]ATP로부터 -33p를 전달하여 용이하게 라벨할 수 있다. 반응이 효과적으로 실행되는 경우에, 이와 같은 프로브의 특이 활성은 [-32P]ATP 또는 [-33P]ATP 자체의 특이 활성정도로 높다. 하기에서 설명하는 반응은 매우 높은 특이활성으로 10pmole 올리고뉴클레오티드를 라벨하도록 고안되어있다. 모든 성분 농도를 일정하게 유지시키면서, 반응 크기를 증가 또는 감소시켜 상이한 양의 올리고뉴클레오티드 라벨링을 용이하게 할 수 있다.Synthetic oligonucleotides were synthesized without phosphate groups at the 5 terminus and delivered -32 p using the enzyme bacteriophage T4 polynucleotide kinase or delivered -33 p from [ -32 P] ATP or [ -33 P] ATP. It can be easily labeled. When the reaction is carried out effectively, the specific activity of such probes is as high as the specific activity of [ -32 P] ATP or [ -33 P] ATP itself. The reaction described below is designed to label 10 pmole oligonucleotides with very high specific activity. While keeping all component concentrations constant, the reaction size can be increased or decreased to facilitate different amounts of oligonucleotide labeling.
1.0㎕ 올리고뉴클레오티드(10pmoles/㎕); 2.0㎕ 10 x 박테리오파아지 T4 폴리뉴클레오티드 카이나제 완충액; 5.0㎕ [-32P]ATP 또는 [-33P]ATP(sp. Act. 5000 Ci/mmole; 수용액상에 10 mCi/㎖)(10pmoles); 11.4㎕ 물을 이용하여 반응 혼합물을 만든다. 박테리오파아지 T4 폴리뉴클레오티드 8 유닛(~1㎕)을 반응 혼합물에 첨가하고, 37℃에서 45분간 배양한다. 반응물은 68℃에서 10분간 가열하여, 박테리오파아지 T4 폴리뉴클레오티드 카이나제를 비활성화시킨다.1.0 μl oligonucleotide (10 pmoles / μl); 2.0 μl 10 × bacteriophage T4 polynucleotide kinase buffer; 5.0 μl [ −32 P] ATP or [ -33 P] ATP (sp. Act. 5000 Ci / mmole; 10 mCi / ml on aqueous solution) (10 pmoles); Prepare the reaction mixture with 11.4 μl water. 8 units (˜1 μl) of bacteriophage T4 polynucleotide are added to the reaction mixture and incubated at 37 ° C. for 45 minutes. The reaction is heated at 68 ° C. for 10 minutes to inactivate the bacteriophage T4 polynucleotide kinase.
올리고뉴클레오티드에32P 또는33P을 효과적으로 전달하는 것과 이의 특이적인 활성을 결정한다. 프로브의 특이적인 활성이 수용가능한 경우에, 이는 정제된 것이다. 특이 활성이 매우 낮은 경우에, 추가 8 유닛 효소를 첨가하고, 37℃에서 추가 30분간 배양한 후에, 68℃에서 10분간 반응물을 가열하여, 효소를 비활성화시킨다.Effective delivery of 32 P or 33 P to oligonucleotides and their specific activity is determined. If the specific activity of the probe is acceptable, it is purified. If the specific activity is very low, an additional 8 unit enzyme is added and incubated at 37 ° C for an additional 30 minutes, then the reaction is heated at 68 ° C for 10 minutes to inactivate the enzyme.
방사능라벨된 올리고뉴클레오티드를 정제하는 방법은 에탄올 침전; 세틸피리미디움 브로마이드를 이용한 침전; bio-gel P-60을 이용한 크로마토그래피; Sep-Pak C18컬럼상에서 크로마토그래피; 폴리아크릴아미드 겔 전기영동을 이용한다.Methods for purifying radiolabeled oligonucleotides include ethanol precipitation; Precipitation with cetylpyrididium bromide; chromatography with bio-gel P-60; Chromatography on a Sep-Pak C 18 column; Polyacrylamide gel electrophoresis is used.
합성 올리고뉴클레오티드에 상보적인 DNA 가닥을 합성하기 위해, 대장균(E. coli) DNA 폴리메라제 I의 Klenow 단편을 이용하여 매우 특이 활성이 큰 프로브를 얻을 수 있다. 짧은 프라이머는 올리고뉴클레오티드 주형에 하이브리드되고, 이 서열은 원하는 방사능라벨된 프로브의 보체가 된다. 그 다음 주형-방향으로 [-32P]dNTPs 또는 [-33P]dNTPs를 결합시키기 위해, 대장균(E. coli) DNA 폴리메라제 I의 Klenow 단편을 이용하여 프라이머를 연장시킨다. 반응 후에, 변성 및 변성 조건하에 폴리아크릴아미드 겔을 통하여 전기영동하여, 주형 및 생성물을 분리한다. 이와 같은 방법으로 올리고뉴클레오티드 분자 하나에 몇 가지 방사능 활성 원자를 포함하는 올리고뉴클레오티드 프로브를 만들 수 있다.In order to synthesize DNA strands complementary to synthetic oligonucleotides, Klenow fragments of E. coli DNA polymerase I can be used to obtain highly specific probes. The short primer is hybridized to an oligonucleotide template, which sequence is the complement of the desired radiolabeled probe. The primer is then extended with a Klenow fragment of E. coli DNA polymerase I to bind [ -32 P] dNTPs or [ -33 P] dNTPs in the template-direction. After the reaction, electrophoresis through a polyacrylamide gel under denaturing and denaturing conditions to separate the mold and the product. In this way, oligonucleotide probes containing several radioactive atoms in an oligonucleotide molecule can be made.
이 방법을 이용하기 위해, 원하는 특이 활성을 얻는데 필수적인 그리고 모든 주형 가닥을 완전하게 합성할 수 있을 정도의 계산된 [a-32P]dNTPs 또는 [a-33P]dNTPs 양을 마이크로퓨즈 튜브에서 혼합한다. 튜브에 적절한 양의 프라이머 및 주형 DNA를 첨가하고, 주형에 비해 3 내지 10배 초과량의 프라이머를 첨가한다.To use this method, the calculated amount of [a-32P] dNTPs or [a-33P] dNTPs necessary to achieve the desired specific activity and sufficient to synthesize all template strands is mixed in a microfuge tube. Appropriate amount of primer and template DNA is added to the tube and 3 to 10 times greater primer than template.
그 다음 0.1 용량의 10 x Klenow 완충액을 첨가하고, 잘 혼합한다. 대장균(E. coli) DNA 폴리메라제 I의 Klenow 단편을 2-4 유닛을 반응물 5㎕에 첨가하고, 혼합한 후에, 4℃에서 2-3시간동안 배양한다. 원한다면, 소량의 반응물을 빼내어, 10% 트리클로로아세트산(TCA)으로 침전할 수 있는 방사능활성 비율을 측정함으로써 반응 공정을 모니터한다.Then add 0.1 volume of 10 x Klenow buffer and mix well. Klenow fragments of E. coli DNA polymerase I are added 2-4 units to 5 [mu] l of the reaction, mixed and incubated at 4 [deg.] C. for 2-3 hours. If desired, the reaction process is monitored by drawing off a small amount of reactant and measuring the radioactive rate that can precipitate with 10% trichloroacetic acid (TCA).
반응물은 동일한 양의 겔-적하 완충액으로 희석하고, 3분간 80℃로 가열하고, 그 다음 전체 샘플을 변성 폴리아크릴아미드 겔에 적하한다. 전기영동 후에, 겔은 자가방사사진을 찍어, 프로브를 국소화시키고, 겔로부터 제거한다. 형광 프로브 라벨링에 대한 다양한 방법을 이용하는데, Brumbaugh et al.(1988)는 형광 라벨된 프라이머 합성에 대해 설명한다. C-5 위치에 부착된 12개 원자로 된 1차 아민 "링커 암"이 있는 데옥시우리딘 유사체를 합성하였다. 유사체 합성 방법은 유기금속 중간생성물을 통하여 2-데옥시우리딘을 유도하여, 5(메틸 프로페노일)-2-데옥시우리딘을 제공한다. 디메톡시트리틸-클로라이드와 반응하여, 이에 상응하는 5-디메톡시트리틸 부가물을 만든다. 메틸 에스테르를 가수분해하고, 활성화시키고, 적절한 모노아실화된 알킬 디아민과 반응시킨다. 정제 후에, 생성된 링커 암 뉴클레오시드는 화학적인 올리고뉴클레오티드 합성에 적합한 뉴클레오티드 유사체로 전환된다.The reaction is diluted with the same amount of gel-drop buffer, heated to 80 ° C. for 3 minutes, and then the entire sample is added dropwise to the modified polyacrylamide gel. After electrophoresis, the gel is self-radiographed to localize the probe and remove it from the gel. Various methods for fluorescent probe labeling are used, Brumbaugh et al. (1988) describe the synthesis of fluorescently labeled primers. Deoxyuridine analogs with a 12 atom primary amine "linker arm" attached at the C-5 position were synthesized. Analogue synthesis methods induce 2-deoxyuridines through organometallic intermediates to give 5 (methyl propenyl) -2-deoxyuridine. Reaction with dimethoxytrityl-chloride gives the corresponding 5-dimethoxytrityl adduct. The methyl ester is hydrolyzed, activated and reacted with the appropriate monoacylated alkyl diamine. After purification, the resulting linker arm nucleosides are converted to nucleotide analogues suitable for chemical oligonucleotide synthesis.
그 다음 올리고뉴클레오티드는 변형된 포스포리디트(phosphoridite) 화학물질을 이용하여 한 개 이상의 링커 암 염기를 포함하도록 만든다. 25㎕ 500mM 중탄산나트륨(pH9.4)에 50nmol 링커 암 올리고뉴클레오티드 용액에 20㎕ 300mM FITC 디메틸 설폭시드를 첨가한다. 혼합물은 6시간동안 실온에서 교반한다. 1 x 30 ㎝ Sephadex G-25 컬럼으로부터 20mM 암모니움 아세테이트(pH 6)로 용출시켜, 자유 FITC로부터 분리한다.The oligonucleotides are then made to contain one or more linker cancer bases using modified phosphoridite chemicals. To 25 μl 500 mM sodium bicarbonate (pH 9.4) add 20 μl 300 mM FITC dimethyl sulfoxide to a 50 nmol linker arm oligonucleotide solution. The mixture is stirred for 6 hours at room temperature. Eluate with 20 mM ammonium acetate (pH 6) from a 1 x 30 cm Sephadex G-25 column to separate from free FITC.
일반적으로, 5'말단에 올리고뉴클레오티드의 형광 라벨링은 두 단계로 이루어진다. 첫째는 자동화된 핵산 합성동안에, N-보호된 아미노알킬 포스포라미디트 유도체를 올리고뉴클레오티드의 5'말단에 첨가한다. 모든 보호기를 제거한 후에, 적절한 형광 염료 NHS 에스테르를 하룻밤동안 5'아미노기에 결합시키고, 역상 HPLC 또는 PAGE를 이용하여 과량의 염료로부터 라벨된 올리고뉴클레오티드를 정제한다.In general, fluorescence labeling of oligonucleotides at the 5 'end consists of two steps. First, during automated nucleic acid synthesis, an N-protected aminoalkyl phosphoramidite derivative is added at the 5 'end of the oligonucleotide. After removal of all protecting groups, the appropriate fluorescent dye NHS ester is bound overnight to the 5 'amino group and purified labeled oligonucleotides from excess dye using reverse phase HPLC or PAGE.
Schubert et al.(1990)는 자동 DNA 합성동안에 형광라벨된 올리고뉴클레오티드를 만들 수 있는 포스포라미디트 합성에 대해 설명한다.Schubert et al. (1990) describe phosphoramidite synthesis, which can produce fluorescently labeled oligonucleotides during automated DNA synthesis.
Murakami et al은 형광물질이 라벨된 올리고뉴클레오티드를 준비하는 방법에 대해 설명한다.Murakami et al describe a method for preparing oligonucleotides labeled with fluorescents.
Cate et al. (1991)는 프로브를 감지하기 위해 직접적인 화학적 발광 물질(AMPPD)과 복합하여 알칼리 포스포다제에 바로 공액된 올리고뉴클레오티드 프로브 이용에 대해 설명하였다.Cate et al. (1991) describe the use of oligonucleotide probes conjugated directly to alkaline phosphodases in combination with a direct chemiluminescent material (AMPPD) to detect probes.
라벨된 프로브는 합성하기보다는 GENSET등을 포함한 다양하게 시판되는 것을 구입하는 것이 좋다.Labeled probes should be purchased from a variety of commercially available products, including GENSET, rather than synthetic.
다른 라벨에는 라벨된 항체, 화학발광물질, 효소 및 라벨된 리간드에 대해 특이적인 결합 짝 구성원으로 작용할 수 있는 항체 및 이와 유사한 것 등에 특이적으로 결합하는 리간드를 포함한다. 이용되는 면역검사에는 다양한 라벨이 이용될 수 있다. 다른 라벨로는 항원, 특이 활성을 가지는 기, 전기화학적으로 감지할 수 있는 부분 등이 포함된다.Other labels include ligands that specifically bind to labeled antibodies, chemiluminescent materials, enzymes and the like that can act as binding partner members specific for labeled ligands. Various labels can be used for the immunoassays used. Other labels include antigens, groups with specific activity, electrochemically detectable moieties, and the like.
일반적으로, 전기단 물질 라벨("EML")을 이용하여 핵산을 라벨링하는 것은 Xu et al., J. Chromatography 764:95-102 (1997)에서 설명하고 있다. 전자단(electrophore)는 전자 포획 질량 스펙트로메터(EC-MS)에 의해 고감도로 감지되는 화합물이다. EMLs는 가역적으로 뉴클레오티드를 변형할 수 있는 공지의 화학물질을 이용하여 프로브에 부착할 수 있다(예를 들면 공지의 뉴클레오티드 합성 화학은 보호기로 뉴클레오티드에 분자를 부착시키는 다양한 방법을 가르친다). 공지의 전자 포집 질량 스펙트로메터 장치(가령, Finnigan Corporation에서 시판하는 장치)를 이용하여 EMLs를 감지한다. 또한, EMLs를 감지하는데 이용되는 기술에는 신속한 전자 충격 질량 스펙트로메터(Koster et al., Biomedical Environ. Mass Spec. 14:111-116 (1987)); 플라즈마 탈착 질량 스펙트로메터; 전자분무/이온분무(Fenn et al., J. Phys. Chem. 88:4451-59 (1984), PCT Appln. No. WO 90/14148, Smith et al., Annal. Chem. 62:882-89 (1990)); 매트릭스-지원된 리이져 탈착/이온화반응(Hillenkamp, et al., "Matrix Assisted UV-Laser Desorption/Ionization: A New Approach to Mass Spectrometry of Large Biomolecules," Biological Mass Spectrometry (Burlingame and McCloskey, eds.), Elsevier Science Publishers, Amsterdam, pp. 49-60, 1990); Huth-Fehre et al., "Matrix Assisted Laser Desorption Mass Spectrometry of Oligodeoxythymidylic Acids," Rapid Communications in Mass Spectrometry, 6:209-13 (1992))등을 포함한다.In general, labeling nucleic acids using shear labeling (“EML”) is described in Xu et al., J. Chromatography 764: 95-102 (1997). Electrophores are compounds that are sensitively detected by an electron capture mass spectrometer (EC-MS). EMLs can be attached to probes using known chemicals that can reversibly modify nucleotides (eg, known nucleotide synthesis chemistry teaches various methods of attaching molecules to nucleotides with protecting groups). EMLs are detected using known electron trapping mass spectrometer devices (eg, commercially available from Finnigan Corporation). In addition, techniques used to detect EMLs include rapid electron impact mass spectrometry (Koster et al., Biomedical Environ. Mass Spec. 14: 111-116 (1987)); Plasma desorption mass spectrometer; Electrospray / ion spray (Fenn et al., J. Phys. Chem. 88: 4451-59 (1984), PCT Appln. No. WO 90/14148, Smith et al., Annal. Chem. 62: 882-89 (1990)); Matrix-supported riser desorption / ionization (Hillenkamp, et al., "Matrix Assisted UV-Laser Desorption / Ionization: A New Approach to Mass Spectrometry of Large Biomolecules," Biological Mass Spectrometry (Burlingame and McCloskey, eds.), Elsevier Science Publishers, Amsterdam, pp. 49-60, 1990); Huth-Fehre et al., "Matrix Assisted Laser Desorption Mass Spectrometry of Oligodeoxythymidylic Acids," Rapid Communications in Mass Spectrometry, 6: 209-13 (1992)).
적절한 구체예에서, EMLs는 감응성이 약한 공유결합에 의해 프로브에 부착된다. 레이져 또는 원하는 빛의 파장을 방출하는 다른 광 소스를 이용하여 표적 핵산과 하이브리드한 후에 프로브로부터 EML이 방출된다. 그 다음 EML은 GC-MS(기체 크로마토그래피-질량 스펙트로메터)에 공급되거나 또는 다른 적절한 장치에 공급되어, 질량을 확인한다.In suitable embodiments, the EMLs are attached to the probe by covalent bonds with low sensitivity. The EML is released from the probe after hybridization with the target nucleic acid using a laser or other light source that emits the desired wavelength of light. The EML is then fed to GC-MS (Gas Chromatography-Mass Spectrometer) or other suitable device to confirm the mass.
실시예 5 ; 서열화 칩 및 배열을 준비Example 5; Prepare Sequencing Chips and Arrays
기본 실시예는 50미크론 표면에 부착된 6-mer을 이용하여, 3 x 3 ㎜크기의 칩을 제공하는데, 이 침을 복합하여, 20 x 20 ㎝ 배열을 만든다. 또 다른 예로는 10×10 미크론에 부착된 9-mer 올리고뉴클레오티드를 이용하여, 9-mer 칩(크기 5 x 5 ㎜)을 만드는 것이다. 각 칩 4000 유닛을 이용하여, 30 x 30 ㎝ 배열을 만든다. 4,000 내지 16,000개 올리고칩 배열의 경우에, 사각 배열을 하고 있다. 플레이트 또는 튜브를 서열화 키트의 일부분으로 배열과 함께 포장한다.The basic embodiment uses a 6-mer attached to a 50 micron surface to provide a 3 x 3 mm size chip, which is combined to create a 20 x 20 cm arrangement. Another example is the use of 9-mer oligonucleotides attached to 10 × 10 microns to make 9-mer chips (5 × 5 mm in size). Using each chip 4000 unit, make a 30 x 30 cm arrangement. In the case of 4,000 to 16,000 oligochip arrays, the array is square. The plate or tube is packaged with the array as part of the sequencing kit.
배열은 물리적으로 또는 소수성 표면으로 인하여 서로 분리되어 있다. 소수성 스트립 분리를 이용하는 한 가지 가능한 방법은 QA Laboratories, Toronto, Canada.에서 생산하는 Iso-Grid Microbiology System 기술을 이용하는 것이다.The arrangements are separated from one another either physically or due to hydrophobic surfaces. One possible method of using hydrophobic strip separation is to use the Iso-Grid Microbiology System technology produced by QA Laboratories, Toronto, Canada.
지난 10년간 분석용 식품 미생물학에 소수성 격자 막 필터(HGMF)를 이용하였는데, 이들은 상당한 범위의 독특한 친화력과 콜로니수를 자동으로 헤아린다. 한가지 상업적으로 이용할 수 있는 격자는 QA Laboratories, Toronto, Canada.의 ISO-GRIDTM으로써, 폴리설폰 고분자(Gelman Tuffryn HT-450, 0.45μ포어 크기) 입방체(60 x 60 ㎝)로, 여기에는 1600(40 x 40)개 사각 쎌로 구성된 검은 소수성 잉크 격자가 프린트되어 있다. HGMF는 진공 필터를 이용하여 박테리아 현탁액으로 이미 접종하여, 차등 또는 선택성 배지상에 배양한다.Over the past decade, hydrophobic lattice membrane filters (HGMF) have been used for analytical food microbiology, which automatically count a large range of unique affinity and colony counts. One commercially available lattice is ISO-GRID ™ from QA Laboratories, Toronto, Canada. It is a polysulfone polymer (Gelman Tuffryn HT-450, 0.45 μ pore size) cube (60 x 60 cm), including 1600 ( A black hydrophobic ink grid of 40 x 40 square rectangles is printed. HGMF is already inoculated with bacterial suspensions using vacuum filters and incubated on differential or selective media.
미생물 생장이 막 위에 공지의 위치 및 크기의 격자 쎌에 한정되기 때문에, 통상의 플레이트 또는 막 필터보다는 HGMF가 MPN 장치에 근접한 기능을 한다. Peterkin et al. (1987)는 이와 같은 HGMFs를 이용하여 HGMF 복제기와 함께 사용할 경우에 게놈 라이브러리를 증식시키고, 저장할 수 있다. 이와 같은 장치는 ISO-GRID의 1600개 쎌 각각에서 생장을 복제하여, 원래 HGMF의 많은 복사체를 만들 수 있다(Peterkin et al., 1987).Since microbial growth is confined to lattice fins of known position and size on the membrane, HGMF functions closer to the MPN device than conventional plates or membrane filters. Peterkin et al. (1987) can use these HGMFs to grow and store genomic libraries when used with HGMF replicators. Such a device can replicate growth in each of the 1600 mu s of ISO-GRID, making many copies of the original HGMF (Peterkin et al., 1987).
Sharpe et al. (1989)는 또한 QA Laboratories의 ISO-GRID HGMF, 자동화된 HGMF 카운터(MI-100 Interpreter), RP-100 Replicator를 이용한다. 많은 미생물 배양물을 유지하고, 스크린하는 기술에 대해 보고하고 있다.Sharpe et al. (1989) also use ISO-GRID HGMF, automated HGMF counter (MI-100 Interpreter), RP-100 Replicator from QA Laboratories. Many techniques have been reported for maintaining and screening microbial cultures.
Peterkin 및 그의 동료는 최근에 소수성 격자-막 필터를 이용하여 DNA 프로브를 스크린하는 방법에 대해 설명하고 있다(Peterkin et al., 1989). 이 저자는 HGMFs상에 직접 효과적으로 콜로니 하이브리드를 하는 방법에 대해 보고하였다. 이전에, HGMFs가 프린트된 에폭시설폰 고분자에 DNA가 잘 결합되지 않기 때문에 좋지 않은 결과를 얻었다. 그러나, Peterkin et al. (1989)은 DNA에 접촉시키기 전에, 복제된 배양된 HGMF를 폴리에틸렌아민, 다가양이온으로 처리하면, 막 표면에 DNA가 결합되는 능력을 개선할 수 있다. 이와 같은 초기 작업은 세포 DNA 부착을 이용하는데, 이는 본 발명과는 다른 목적으로 설명되는 방법은 Format 3 SBH를 채택한다.Peterkin and his colleagues have recently described how to screen DNA probes using hydrophobic lattice-membrane filters (Peterkin et al., 1989). The authors report how to effectively and efficiently colony hybrids directly on HGMFs. Previously, poor results were obtained because DNA was poorly bound to the epoxysulfone polymers printed with HGMFs. However, Peterkin et al. (1989), by treating cloned cultured HGMF with polyethyleneamine, polycationic, prior to contacting DNA, can improve the ability of DNA to bind to the membrane surface. This initial work uses cellular DNA attachment, which employs Format 3 SBH, a method described for purposes other than the present invention.
유용한 서열을 신속하게 확인하기 위해서, Peterkin et al. (1989)는 다양한 클론으로부터 방사능라벨된 플라스미드 DNA를 이용하고, 준비된 HGMFs에서 DNA에 대해 이의 특이성을 테스트한다. 이와 같은 방법으로, 용이하게 그리고 반복적으로 만들 수 있는 HGMF 복제물에서 100개 유기체에 대해 콜로니 하이브리드 반응으로 재조합 플라스미드 DNA를 신속하게 스크린할 수 있다.To quickly identify useful sequences, see Peterkin et al. (1989) uses plasmid DNA radiolabeled from various clones and tests its specificity for DNA in prepared HGMFs. In this way, recombinant plasmid DNA can be quickly screened by colony hybrid reactions for 100 organisms in HGMF replicates that can be easily and repeatedly made.
작은(2-3㎜) 칩으로 수천가지 반응을 나란하게 실행할 수 있다. 본 발명의 해답은 칩과 프로브를 이에 상응하는 배열에 유지시키는 것이다. 한 가지 예로써, 250,000개 9-mers를 포함하는 칩을 실리콘 웨이퍼에서 합성하는데, 그 형태는 1mM 홈을 가지는 8 x 12 Format(96개 칩)으로 배열된 8 x 8mM 플레이트(15 uM/올리고뉴클레오티드, Pease et al., 1994) 형태로 합성된다. 프로브는 다중 채널 피펫 또는 핀 배열을 이용하여, 한 개 침에 한 개 프로브를 첨가할 수 있다. 4000개 6-mers 모두 기입하기 위해서는, 42개 칩 배열을 이용해야 하는데, 상이한 것을 이용하거나 또는 한 개 세트 칩 배열을 여러 차례 다시 이용할 수 있다.Small (2-3 mm) chips can perform thousands of reactions side by side. The solution of the present invention is to keep the chip and probe in the corresponding arrangement. As an example, a chip containing 250,000 9-mers is synthesized on a silicon wafer, in the form of an 8 x 8 mM plate (15 uM / oligonucleotide) arranged in an 8 x 12 Format (96 chips) with 1 mM grooves. , Pease et al., 1994). The probe may add one probe to one needle, using a multichannel pipette or pin arrangement. To write all 4000 6-mers, 42 chip arrays must be used, either different or one set chip array multiple times.
상기 경우에서, 출원 초기 목록을 이용하여, F=9; P=6; F + P = 15이다. 칩은 BxNn 식의 프로브를 가지는데, 이때 x는 특정 염기 B의 수를 나타내고; n은 비-특정 염기의 수를 나타내고, 따라서 x = 4 내지 10이고; n=1 내지 4이다. 좀더 효과적인 하이브리드 반응을 얻고, 임의 서포트 올리고뉴클레오티드의 영향을 피하기 위해서, 특정 염기는 불특정 염기로 에워싸고, 따라서, (N)nBx(N)m(도 4)로 나타낼 수 있다.In this case, using the initial list of applications, F = 9; P = 6; F + P = 15. The chip has a probe of the formula BxNn, where x represents the number of specific base B; n represents the number of non-specific bases, and therefore x = 4 to 10; n = 1 to 4. In order to obtain more effective hybrid reactions and to avoid the effects of any support oligonucleotides, certain bases are surrounded by unspecified bases and thus can be represented by (N) nBx (N) m (FIG. 4).
칩의 또 다른 구체예에서, 올리고뉴클레오티드 프로브의 배열을 서포트하는 기질은 섹션으로 분할하여 배열에 각 프로브는 소수성 물질이 되는 물리적인 장벽에 의해 인접 프로브와 구별된다. 적절한 구체예에서, 물리적인 장벽은 300㎛ 내지 30㎛ 폭을 가지고, 악 물리적인 장벽의 중심에서 인접하는 물리적인 장벽의 중심까지 거리는 적어도 325㎛이다.In another embodiment of the chip, the substrate supporting the array of oligonucleotide probes is divided into sections so that each probe in the array is distinguished from adjacent probes by a physical barrier that becomes a hydrophobic material. In a suitable embodiment, the physical barrier has a width of 300 μm to 30 μm, and the distance from the center of the bad physical barrier to the center of the adjacent physical barrier is at least 325 μm.
적절한 구체예에서, 소수성 물질은 적절한 로봇 시스템에 결합된 잉크-젯 헤드를 이용하의 원하는 폭의 장벽을 만들기 위해 기질에 침착시킨다. 가령, 마이크로드롭 도징 헤드의 경우에, 이는 원하는 소수성 물질 용액 또는 현탁액(가령, 용매가 기화된 후에 장벽을 형성하는 오일계 물질)에 이용하도록 하는 것으로, 이를 안로드 간트리 시스템에 결합시키거나, 적절한 수용 및 분배 시스템에 고정시켜, 소수성 물질의 격자가 기질상에 다수의 웰을 형성하는 원하는 기질에 제공된다. 소수성 물질의 격자가 형성된 후에, 격자를 만드는데 이용된 것과 유사하나 프로브 현탁액 또는 용액에 사용하도록 된 로봇 시스템을 이용하여 상이한 프로브를 각 웰에 스팟한다(또는 프로브 혼합물을 각 웰에 공급하고). 한 구체예에서, 동일한 로봇 시스템을 이용하여 소수성 격자 및 프로브를 제공한다. 이와 같은 구체예에서, 분배 시스템은 소수성 격자에 프로브 운반을 위해 프라임시킨 후에 용액으로 채운다.In a suitable embodiment, the hydrophobic material is deposited on a substrate to create a barrier of the desired width using an ink-jet head coupled to a suitable robotic system. For example, in the case of a microdrop dosing head, this is intended for use with a desired hydrophobic solution or suspension (e.g., an oil-based material that forms a barrier after the solvent has been vaporized), which is incorporated into an Anrod Gantry system, Secured in a suitable receiving and dispensing system, a grid of hydrophobic material is provided to the desired substrate to form a plurality of wells on the substrate. After the lattice of hydrophobic material is formed, a different probe is spotted into each well (or a probe mixture is supplied to each well) using a robotic system similar to that used to make the lattice but adapted for use in probe suspensions or solutions. In one embodiment, the same robotic system is used to provide hydrophobic gratings and probes. In such embodiments, the dispensing system is primed for probe delivery to the hydrophobic lattice and then filled with solution.
실시예 6 ; 서포트 결합된 올리고뉴클레오티드의 준비Example 6; Preparation of Support Bound Oligonucleotides
작은 핵산 단편과 같은 올리고뉴클레오티드는 통상적으로 이용하는 자동화된 올리고뉴클레오티드 합성기 등을 이용하여 만드는 것과 같은 화학적 수단을 이용하여 직접적으로 올리고뉴클레오티드를 합성하여 준비할 수 있다.Oligonucleotides, such as small nucleic acid fragments, can be prepared by synthesizing oligonucleotides directly using chemical means such as those made using conventional automated oligonucleotide synthesizers and the like.
일반적으로, 올리고뉴클레오티드는 적절한 반응기를 통하여 서포트에 결합된다. 이와 같은 반응기는 당분야에 잘 공지된 것으로, 아미노(-NH2), 하이드록실(-OH), 카르복실(CO2H)기등이 포함된다. 서포트에 결합된 올리고뉴클레오티드는 유리, 폴리스테렌, 테플론과 같은 임의 적절한 서포트를 이용하여 당업자에 공지된 임의 방법을 이용하여 만든다. 한 가지 방법은 표준 합성기에 의해 합성된 올리고뉴클레오티드를 정확하게 알아 맞추는 것이다. 고정화는 수동 흡착(Inouye & Hondo, 1990); UV 광(Nagata et al., 1985., 1985; Dahlen et al., 1987; Morriey & Collins, 1989); 또는 염기 변형된 DNA의 공유결합 등을 이용하여 얻을 수 있고(Keller et al., 1988; 1989), 여기에 참고문헌을 첨부한다.In general, oligonucleotides are bound to the support through appropriate reactors. Such reactors are well known in the art and include amino (-NH 2 ), hydroxyl (-OH), carboxyl (CO 2 H) groups and the like. Oligonucleotides bound to the support are made using any method known to those of skill in the art using any suitable support such as glass, polystyrene, Teflon. One method is to accurately match oligonucleotides synthesized by standard synthesizers. Immobilization is passive adsorption (Inouye & Hondo, 1990); UV light (Nagata et al., 1985., 1985; Dahlen et al., 1987; Morriey & Collins, 1989); Or by covalent linkage of base-modified DNA (Keller et al., 1988; 1989), to which reference is attached.
이용할 수 있는 또 다른 전략은 링커로 강한 바이오틴-스트렙타아비딘 상호작용을 이용하는 것이다. 예를 들면, Broude et al. (1994)는 이들이 이중나선 프로브이지만, 스트렙타아비딘-피복된 자석 비드에 고정된 바이오티닐화된 프로브를 이용하는 것에 대해 설명한다. Dynal, Oslo로부터 스트렙타아비딘-피복된 비드를 구입할 수 있다. 물론, 이와 동일한 링크 화학물질을 스트렙타아비딘이 있는 임의 표면에 피복하는데 이용할 수 있다. 바이오티닐화된 프로브는 다양한 소스 예를 들면, Operon Technologies(Alameda, CA)에서 구입할 수 있다.Another strategy available is to use strong biotin-streptavidin interactions with the linker. For example, Broude et al. (1994) describe the use of biotinylated probes immobilized on streptavidin-coated magnetic beads, although these are double helix probes. Streptavidin-coated beads can be purchased from Dynal, Oslo. Of course, the same link chemistry can be used to coat any surface with streptavidin. Biotinylated probes can be purchased from a variety of sources, such as Operon Technologies (Alameda, Calif.).
Nunc Laboratories(Naperville, IL) 또한 이용할 수 있는 적절한 물질을 시판한다. Nunc Laboratories는 Covalink NH라 불리는 마이크로웰 표면에 DNA를 공유결합시키는 방법을 개발하였다. CovaLink NH는 추가 공유결합의 연결 머리로 작용하는 2차 아미노기(>NH)가 붙은 폴리스티렌 표면이다. CovaLink Modules은 Nunc Laboratories에서 구입할 수 있다. DNA 분자는 포스포라미데이트 결합에 의해 5' 말단에서 CovaLink에 독점적으로 결합되어, 1pmol DNA(Rasmussen et al., 1991)보다 많은 양을 고정할 수 있다.Nunc Laboratories (Naperville, IL) also commercially available suitable materials. Nunc Laboratories has developed a method of covalently binding DNA to the surface of a microwell called Covalink NH. CovaLink NH is a polystyrene surface with a secondary amino group (> NH) that acts as a linking head for further covalent bonds. CovaLink Modules are available from Nunc Laboratories. DNA molecules can be bound exclusively to CovaLink at the 5 'end by phosphoramidate linkages to immobilize more than 1 pmol DNA (Rasmussen et al., 1991).
5' 말단에서 DNA 분자의 공유 결합을 위해 CovaLink NH 스트립을 이용하는 것에 대해 설명한다(Rasmussen et al., 1991). 이 기술에서, 포스포라미데이트 결합을 이용한다(Chu et al., 1983). 이는 오로지 한 개 공유 결합을 이용하는 고정화반응이 바람직하기 때문에 유익하다. 포스포라미데이트 결합은 폴리스티렌 표면상에 2㎚ 길이의 스페이서 암을 통하여 공유적으로 결합된 스페이스 단부에 위치한 CovaLink NH 2차 아미노기에 DNA를 결합시킨다. 포스포라미데이트 결합을 통하여, CovaLink NH에 올리고뉴클레오티드를 연결시키기 위해, 올리고뉴클레오티드 말단에는 5'단부 인산염기를 가지고 있어야 한다. 아마도, CovaLink에 바이오틴이 공유결합되는 것이 가능하고, 프로브를 결합시키는데 이용하는 스트렙타아비딘을 이용한다.The use of CovaLink NH strips for covalent binding of DNA molecules at the 5 'end is described (Rasmussen et al., 1991). In this technique, phosphoramidate binding is used (Chu et al., 1983). This is advantageous because immobilization using only one covalent bond is preferred. Phosphoramidate binding binds DNA to the CovaLink NH secondary amino group located at the end of the space covalently bound through a 2 nm long spacer arm on the polystyrene surface. In order to link oligonucleotides to CovaLink NH via phosphoramidate linkages, the oligonucleotide ends must have a 5 ′ end phosphate group. Perhaps it is possible to covalently bind biotin to CovaLink and use streptavidin, which is used to bind the probe.
좀더 구체적으로는, 연결 방법에는 물에 DNA를 용해시키고(7.5ng/㎕), 10분간 95℃에서 변성시키고, 얼음에서 10분간 냉각시킨다. 얼음에 보관한 0.1M 1-메틸이미다졸, pH7.0(1-MeIm7)을 최종 농도가 10mM 1-MeIm7이 되로록 첨가한다. 그 다음 ss DNA 용액을 얼음에 보관한 CovaLink NH 스트립(75㎕/well)에 넣는다.More specifically, the linkage method involves dissolving DNA in water (7.5 ng / μl), denaturing at 95 ° C. for 10 minutes, and cooling on ice for 10 minutes. 0.1 M 1-methylimidazole, pH 7.0 (1-MeIm 7 ), stored on ice, is added to a final concentration of 10 mM 1-MeIm 7 . The ss DNA solution is then placed in CovaLink NH strips (75 μl / well) stored on ice.
10 mM 1-MeIm7에 용해된 카르보디이미드 0.2 M 1-에틸-3-(3-디메틸아미노프로필)-카르보디이미드(EDC)를 새로 만들고, 각 웰에 25㎕씩 첨가한다. 스트립은 50℃에서 5시간 동안 배양한다. 배양 후에, 스트립은 Nunc-Immuno 세척액으로 세척하는데; 우선 웰은 3회 세척하고, 그 다음 5분간 세척 용액을 흡수하도록 하고; 최종적으로 3회 세척한다(이때 세척용액은 0.4 N NaOH, 0.25% SDS로 50℃로 가열한 것이다).Carbodiimide 0.2 M 1-ethyl-3- (3-dimethylaminopropyl) -carbodiimide (EDC) dissolved in 10 mM 1-MeIm 7 is made fresh and 25 μl is added to each well. The strip is incubated at 50 ° C. for 5 hours. After incubation, the strips are washed with Nunc-Immuno washes; The wells are washed three times and then allowed to absorb the wash solution for 5 minutes; Finally wash 3 times (the wash solution was heated to 50 ° C. with 0.4 N NaOH, 0.25% SDS).
본 발명을 이용할 수 있는 추가 적절한 방법은 PCT 특허 출원 WO 90/03382 (Southern & Maskos)에서 설명한다. 서포트에 결합된 올리고뉴클레오티드를 준비하는 방법은 서포트가 가지고 있는 지방족 하이드록시기에 포스포디에스테르 공유 연결을 하여 인산염기를 통하여 뉴클레오시드 3'-시약에 부착하는 것이다. 그 다음 올리고뉴클레오티드는 서포트된 뉴클레오티드상에 합성되고, 보호기는 서포트로부터 올리고뉴클레오티드가 절단되지 않는 적절한 조건하에 합성 올리고뉴클레오티드로부터 제거한다. 적절한 시약에는 뉴클레오시드 포스포라미디트 및 뉴클레오시드 수소 인산염을 포함한다.Further suitable methods of using the invention are described in PCT patent application WO 90/03382 (Southern & Maskos). The method for preparing an oligonucleotide bound to a support is to attach a phosphodiester covalent linkage to an aliphatic hydroxy group possessed by the support and attach it to the nucleoside 3'-reagent through a phosphate group. The oligonucleotides are then synthesized on the supported nucleotides and the protecting group is removed from the synthetic oligonucleotides under appropriate conditions such that the oligonucleotides are not cleaved from the support. Suitable reagents include nucleoside phosphoramidite and nucleoside hydrogen phosphate.
DNA 프로브 배열을 준비하기 위해, DNA 프로브를 준비하는 온-칩(on-chip) 전략을 이용한다. 예를 들면, 유리 표면에 직접 올리고뉴클레오티드를 화학적으로 합성하는데 어드레스블 레이져-활성화된 광탈착을 이용한다(Fodor et al.(1991)). 프로브는 또한 Van Ness et al. (1991)에서 설명하는 것과 같이 나일론 서포트에 고정시키거나 Duncan & Cavalier (1988)의 방법을 이용하여 테플론에 연결한다.To prepare a DNA probe array, an on-chip strategy of preparing a DNA probe is used. For example, addressable laser-activated photodesorption is used to chemically synthesize oligonucleotides directly on the glass surface (Fodor et al. (1991)). Probes are also described in Van Ness et al. Fix it to nylon support as described in (1991) or connect it to Teflon using the method of Duncan & Cavalier (1988).
Van Ness et al. (1991)에서 설명하는 것과 같이 나일론 서포트에 올리고뉴클레오티드를 연결하기 위해, 시안우릭 클로라이드와 올리고뉴클레오티드의 5'아민의 알킬화 및 선택적인 활성화를 통하여, 나일론 표면을 활성화한다.Van Ness et al. In order to link oligonucleotides to the nylon support as described in (1991), the surface of the nylon is activated through alkylation and selective activation of cyanuric chloride with the 5'amine of the oligonucleotide.
서포트에 결합된 올리고뉴클레오티드를 준비하기 위한 한 가지 특별한 방법은 Pease et al., (1994)에서 설명하는 광-발생되는 합성을 이용하는 것이다. 발명자들은 현재 광무기(photolithographic) 기술을 이용하여, 고정된 올리고뉴클레오티드 프로브(DNA 칩) 배열을 만든다. 고밀도로 올리고뉴클레오티드 프로브를 합성하는데 빛을 이용하는 이 방법은 빛에 불안정한 5'-보호된 N-아실-데옥시뉴클레오시드 포스포라미디트, 표면 링커 화학물질, 다양한 복합 합성 전략을 이용한다. 256개 공간적으로 한정된 올리고뉴클레오티드 매트릭스를 이와 같은 방법으로 만들고, 그 다음 여기에서 설명하는 것과 같은 유익한 Format 3 서열화에 이용한다.One particular method for preparing oligonucleotides bound to supports is to use the photo-generated synthesis described in Pease et al., (1994). The inventors now use photolithographic techniques to create immobilized oligonucleotide probe (DNA chip) arrays. This method of using light to synthesize oligonucleotide probes at high density utilizes light labile 5′-protected N-acyl-deoxynucleoside phosphoramidites, surface linker chemicals, and various complex synthesis strategies. 256 spatially defined oligonucleotide matrices are made in this manner and then used for beneficial Format 3 sequencing as described herein.
물론, 상업적으로 이용할 수 있는 상기에서 설명하는 광-활성화된 칩중 하나인 DNA 칩을 용이하게 구입할 수 있다. 이 경우, Affymetrix of Santa Clara, CA 95051, 및 Beckman과 접촉할 수 있다.Of course, one can readily purchase DNA chips, one of the photo-activated chips described above that are commercially available. In this case, Affymetrix of Santa Clara, CA 95051, and Beckman can be contacted.
적절한 구체예에서, 본 발명의 프로브에는 정보 부분(표적 핵산에 하이브리드되어, 서열 정보를 제공하는 부분); 기질(고형 서포트)에 부착되는 반응기; 무작위 위치(가령, 이들 위치에서 네 개 염기중 임의의 것이 결합되는 것을 볼 수 있음)등이 포함된다. 적절한 프로브는 5'-(T)6-(N)3-(B)5서열을 가지는데, 이때 T는 티민(고형 서포트에 결합)이고, N = A, C, G, T(무작위화 위치), B = 프로브의 5개 정보 위치(정보 부분)가 된다. 가장 적절한 구체예에서, 프로브는 서포트에 결합되고, 스페이스 부분은 프로브의 말단 또는 프로브의 내부 또는 (N)3의 5'에서 발견된다. 스페이스는 탄소, 실리콘, 산소, 황, 인산등돠 같은 적어도 2개의 공유 결합을 이루는 원자 또는 당-인산염기, 아미노산, 펩티드, 뉴클레오시드, 뉴클레오티드, 당, 탄수화물, 방향족 링, 탄화수소 고리, 선형 및 분지쇄 형 탄화수소등과 같은 적어도 두 개의 공유 결합을 만드는 분자로 구성된다.In a suitable embodiment, the probes of the present invention include an information portion (a portion hybridized to a target nucleic acid to provide sequence information); A reactor attached to a substrate (solid support); Random positions (eg, any of the four bases can be seen to be bound at these positions), and the like. Suitable probes have the sequence 5 '-(T) 6- (N) 3- (B) 5 , where T is thymine (binds to a solid support) and N = A, C, G, T (randomized position) ), B = five information positions (information parts) of the probe. In the most suitable embodiment, the probe is bound to the support and the space portion is found at the end of the probe or inside the probe or at 5 'of (N) 3 . Spaces are atoms or sugar-phosphate groups, amino acids, peptides, nucleosides, nucleotides, sugars, carbohydrates, aromatic rings, hydrocarbon rings, linear and at least two covalent bonds such as carbon, silicon, oxygen, sulfur, phosphate, etc. It consists of molecules that make at least two covalent bonds, such as branched hydrocarbons.
실시예 7 ; 핵산 단편 준비Example 7; Nucleic Acid Fragment Preparation
서열화할 핵산은 cDNA, 게놈 DNA, 염색체 DNA, 미세하게 절단한 염색체 밴드, 코스미드 또는 YAC 삽입체, 임의 증식 단계 없은 mRNA를 포함한 RNA와 같은 임의 적절한 소스에서 얻을 수 있다. 예를 들면, Sambrook et al. (1989)은 포유류 세포로부터 고분자량 DNA를 분리하는 세 가지 과정에 대해 설명하고 있다(p. 9.14-9.23).The nucleic acid to be sequenced can be obtained from any suitable source such as cDNA, genomic DNA, chromosomal DNA, finely cut chromosomal bands, cosmids or YAC inserts, RNA including mRNA without any proliferation step. For example, Sambrook et al. (1989) describe three processes for separating high molecular weight DNA from mammalian cells (p. 9.14-9.23).
표적이 되는 핵산 단편은 M13, 플라스미드 또는 람다 벡터에 클론하여 준비하거나, 게놈 DNA에서 직접 만들거나 PCR 또는 다른 증폭 방법을 이용하여 cDNA로부터 얻을 수 있다. 샘플은 다중 웰 플레이트에 준비하거나 분배한다. 약 100-1000ng DNA를 최종 용적이 2-500㎖이 되도록 한다. PCR을 이용하여 준비한 표적 핵산은 정제과정없이 Format I SBH용 기질에 바로 적용시킨다. 일단 표적 핵산을 기질에 고정시킨 후에, 기질을 세척하거나 프로브에 바로 어닐링한다.Targeted nucleic acid fragments can be prepared by cloning into M13, plasmid or lambda vectors, made directly from genomic DNA, or obtained from cDNA using PCR or other amplification methods. Samples are prepared or dispensed in multiple well plates. Approximately 100-1000 ng DNA is allowed to have a final volume of 2-500 ml. The target nucleic acid prepared by PCR is directly applied to the substrate for Format I SBH without purification. Once the target nucleic acid is immobilized on the substrate, the substrate is washed or annealed directly to the probe.
그 다음 핵산은 당업자에게 공지된 방법 가령, Sambrook et al. (1989)의 9.24-9.28에 설명하는 제한효소를 이용하거나 초음파분쇄 및 NaOH 처리 등의 방법을 이용하여 단편으로 만든다.The nucleic acid is then used in methods known to those skilled in the art, such as Sambrook et al. (1989) into fragments using the restriction enzymes described in 9.24-9.28 or by methods such as sonication and NaOH treatment.
Schriefer et al. (1990)에서 설명하고 있는 저압 전단도 적절한 방법이다. 이 방법에서, DNA 샘플은 저압에서 중간 압력까지 다양한 압력에서 작은 French 압력 쎌을 통과하게 된다. 레버 장치를 이용하여 쎌에 압력을 저압에서 중간압력으로 조절할 수 있다. 이 연구 결과에 따르면, 저압 전단은 초음파 및 효소를 이용한 DNA 단편화 방법에 대체할 수 있는 것으로 나타났다.Schriefer et al. Low pressure shear as described in (1990) is also an appropriate method. In this method, the DNA sample passes through a small French pressure shock at various pressures, from low to medium pressure. The lever system can be used to adjust the pressure from low to medium. The results show that low-pressure shear can be substituted for DNA fragmentation using ultrasound and enzymes.
DNA를 단편화하는 적절한 방법중 하나는 Fitzgerald et al(1992)에서 설명하는 두개 염기를 인지하는 엔도뉴클레아제, CviJI를 이용하는 것이다. 발명자는 특정 크기로 DNA를 단편 및 분취하는 신속한 방법에 대해 설명하는데 이는 쇼건(shotgun) 클로닝 및 서열화에 적합하다. 본 발명자는 본 발명의 서열화 기술에 이용할 수 있는 상대적으로 작은 무작위 DNA 단편을 만드는데 이 방법이 유용할 것으로 판단하였다.One suitable method of fragmenting DNA is to use an endonuclease, CviJI, which recognizes the two bases described in Fitzgerald et al (1992). The inventors describe a rapid method of fragmenting and fractionating DNA at a particular size, which is suitable for shotgun cloning and sequencing. We have found this method to be useful for making relatively small random DNA fragments that can be used in the sequencing techniques of the present invention.
제한 엔도뉴클레아제 CviJI는 G와 C사이에 인지서열인 PuGCPy을 정상적으로 절단하여, 블런트 말단을 만든다. 이 효소의 특이성을 변형시킨(CviJI**) 비전형적인 반응 조건을 이용하면, 소분자 pUC19(2688개 염기쌍)로부터 준-무작위한 DNA 단편을 만든다. Fitzgerald et al. (1992)는 pUC19를 CviJI**으로 처리한 단편을 신속한 겔 여과 방법을 이용하여 크기 분취하고, 단부 복구없이 바로 lac Z minus M13 벡터에 결찰시켜, 이와 같은 분절 전략의 무작위성을 정량적으로 평가하였다. 76개 클론의 서열 분석에 따르면, CviJI**는 PuGCPy 부위에 추가하여, pyGCPy 및 PuGCPu를 제한하고, 무작위 단편화와 일치하는 속도로 새로운 서열 데이터가 축적되었다.The restriction endonuclease CviJI normally cleaves PuGCPy, a cognitive sequence between G and C, to produce blunt ends. Using atypical reaction conditions that modify the specificity of this enzyme (CviJI ** ), DNA fragments are made semi-random from small molecule pUC19 (2688 base pairs). Fitzgerald et al. (1992) quantitatively assessed the randomness of this segmentation strategy by fractionating pUC19 treated with CviJI ** sized fractions using rapid gel filtration and ligating directly to the lac Z minus M13 vector without end repair. According to the sequence analysis of 76 clones, CviJI ** was added to the PuGCPy site, limiting pyGCPy and PuGCPu and accumulating new sequence data at a rate consistent with random fragmentation.
문헌에서 보고하는 것과 같이, 초음파분쇄 및 아가로즈 겔 분취 방법과 비교하였을 경우에 이 방법의 장점은 필요한 DNA 양이 더 작고(2-5㎍대신에 0.2-0.5㎍로도 충분하고); 관련 단계의 수가 더 적다(선결찰, 단부 복구, 화학적인 추출이 필요 없고, 아가로즈 겔 전기영동 및 용출이 필요하다). 이와 같은 장점으로 Format 3에 의한 서열화에 사용할 DNA를 준비할 경우에 이용할 수 있다.As reported in the literature, the advantages of this method when compared to the methods of sonication and agarose gel fractionation are that the amount of DNA required is smaller (0.2-0.5 μg is sufficient instead of 2-5 μg); The number of steps involved is lower (no ligation, end repair, chemical extraction, agarose gel electrophoresis and elution). This advantage can be used when preparing DNA for sequencing by Format 3.
적절한 구체예에서, 핵산 샘플의 "단편"은 풀에서 다른 단편과는 결찰되지 않는다. 이와 같은 단편 물은 분별된 핵산을 포스포타제(가령, 송아지 내장 포스포타제)로 처리하여 수득할 수 있다. 또는, 샘플 핵산의 비-결찰된 단편은 샘플 핵산의 Sanger-양대툐 서열화 반응에서 무작위 프라이머(e.g., N5-N9, 이때 N = A. G. T. or C)를 이용하여 수득할 수 있다. 이로써 표적 핵산에 상보적인 서열을 가지는 DNA 단편을 만들고, 다른 단편에 결찰안된 디데옥시 잔기에서 종료된다.In suitable embodiments, "fragments" of nucleic acid samples are not ligated with other fragments in the pool. Such fragments can be obtained by treating fractionated nucleic acids with phosphatase (eg, calf visceral phosphatase). Alternatively, non-ligated fragments of sample nucleic acids can be obtained using random primers (eg, N 5 -N 9 , where N = AGT or C) in the Sanger-versus sequencing reaction of the sample nucleic acid. This creates a DNA fragment having a sequence complementary to the target nucleic acid and terminates at the dideoxy residue not ligated to the other fragment.
핵산 단편을 얻거나 준비하는 방법에 관계없이, 하이브리드에 이용할 수 있는 단일 가닥 조각으로 DNA를 변성시키는 것이 중요하다. 80-90℃에서 2-5분간 DNA 용액을 배양하면 DNA를 변성시킬 수 있다. 그 다음, DNA 단편이 다시 재생되는 것을 방지하기 위해, 용액은 2℃로 신속하게 냉각시키고, 칩과 접촉시킨다.Regardless of how the nucleic acid fragments are obtained or prepared, it is important to denature the DNA into single stranded fragments available for hybridization. DNA can be denatured by incubating the DNA solution at 80-90 ° C. for 2-5 minutes. The solution is then rapidly cooled to 2 ° C. and contacted with the chip to prevent DNA fragments from regenerating again.
실시예 8 ; DNA 배열 준비Example 8; DNA Array Preparation
나일론 막과 같은 서포트에 DNA 샘플을 점을 찍어 배열을 만든다. 나일론 막에 약 20nl DNA 용액을 옮기는 것을 반복적으로 하기 위한 금속 핀 배열(미량적정 플레이트에 있는 웰 배열에 상응하는 위치를 가짐)을 이용하여 스팟팅을 한다. 오프셋 프린팅으로, 웰의 밀도보다 도트의 밀도를 더 높일 수 있다. 이용되는 라벨 타입에 따라 1 ㎟내에 1 내지 25개 도트를 수용한다. 일부 미리 선택된 수의 줄과 컬럼에 스팟팅을 피하여, 별도의 서브세트(서브배열)을 만들 수 있다. 한개 서브배열에 있는 샘플은 다른 개체로부터 얻은 동일한 게놈 DNA 단편(또는 동일한 유전자)이거나 다른 겹쳐지는 게놈 클론일 수 있다. 각 서브배열은 동일한 샘플의 복제 스팟팅을 나타낸다. 한 예로써, 선택된 유전자 단편은 64명의 환자로부터 증폭시킬 수 있다. 각 환자의 경우에 증폭된 유전자 단편은 한개의 96-웰 플레이트에 있을 수 있다(96웰 모두에는 동일한 샘플을 포함함). 64명 환자 각각에 대한 플레이트를 준비한다. 96-핀 장치를 이용하여 모든 샘플은 한 개의 8 x 12 ㎝막에 스팟한다. 서브배열에는 각 환자마다 한 개씩, 64개 샘플을 포함한다. 96개 서브배열이 동일한 경우에, 도트 범위는 1㎟가 되고, 서브배열간에 1㎜ 공간이 있다.Dot the DNA sample on a support such as a nylon membrane to create an array. Spotting is carried out using metal pin arrays (having positions corresponding to well arrays in microtiter plates) to repeatedly transfer about 20 nl DNA solution onto the nylon membrane. With offset printing, the density of dots can be made higher than the density of wells. Depending on the label type used, 1 to 25 dots are accommodated within 1 mm 2. By avoiding spotting on some preselected number of rows and columns, you can create separate subsets (subarrays). Samples in one subarray can be the same genomic DNA fragment (or the same gene) from another individual or different overlapping genomic clones. Each subarray represents duplicate spotting of the same sample. As an example, the selected gene fragment can be amplified from 64 patients. For each patient the amplified gene fragments may be in one 96-well plate (all 96 wells contain the same sample). Prepare plates for each of 64 patients. All samples are spotted on one 8 × 12 cm membrane using a 96-pin device. The subarray contains 64 samples, one for each patient. In the case where the 96 sub arrays are the same, the dot range is 1 mm 2 and there is a 1 mm space between the sub arrays.
또 다른 방법은 물리적인 스페이스 예를 들면 막위에 몰드한 플라스틱 격가를 이용하여 분할되는 막 또는 플레이트(NUNC, Naperville, Illinois)를 이용하는 것인데, 격자는 다중웰 플레이트의 바닥에 제공하는 막 종류 또는 소수성 스트립과 유사하다. 고정된 물리적인 스페이스는 편평한 인-저장 스크린 또는 x-선 필름에 노출시켜 상을 만드는 경우에는 적합하지 않다.Another approach is to use membranes or plates (NUNC, Naperville, Illinois) that are partitioned using physical spaces, for example, plastic prices molded over the membranes, where the grating is a membrane type or hydrophobic strip that provides the bottom of a multiwell plate Similar to Fixed physical space is not suitable when the image is made by exposure to a flat in-storage screen or x-ray film.
실시예 9 ; 하이브리드반응 및 기록 과정Example 9; Hybrid reaction and recording process
라벨된 프로브는 하이브리드 완충액과 혼합하고, 다중채널 피펫을 이용하여, 서브배열에 피펫팅한다. 서브배열간에 프로브가 혼합되는 것을 방지하기 위해(소수성 스트립 또는 막사이에 주입된 물리적인 장벽이 없는 경우에), 상응하는 플라스틱, 금속 또는 세라믹 그리드를 막에 단단하게 고정시킨다. 또는, 완충액의 용적을 ㎟당 약 1㎖ 또는 그 이하로 감소시킨다. 프로브 농도 및 이용되는 하이브리드 반응 조건은 이전에 설명한 것과 동일하나, 단 세척 완충액을 서브배열의 배열위로 신속하게 부어, 프로브가 빨리 희석되도록 하여 교차-하이브리드 반응을 방지한다. 동일한 이유로, 최소 농도의 프로브를 이용하고, 하이브리드 시단은 최대 수준으로 연장한다. DNA 감지 및 서열화를 위해, "정상" 서열에 대한 지식을 이용하여, 시그날을 증가시키기 위해 지속적인 스태킹 상호작용 현상을 이용한다. 라벨된 프로브에 추가하여, 하이브리드 반응에 라벨된 것과 후방-후방(back to back) 하이브리드를 하는 라벨안된 프로브를 첨가한다. 하이브리드 양이 몇 배로 증가된다. 프로브는 결찰에 의해 연결된다. 이와 같은 방법은 "압축"을 이루는 DNA 부분을 푸는데 중요하다.Labeled probes are mixed with hybrid buffer and pipetted into subarrays using multichannel pipettes. To prevent mixing of the probes between the subarrays (in the absence of a physical barrier injected between the hydrophobic strips or membranes), the corresponding plastic, metal or ceramic grid is securely fixed to the membrane. Alternatively, the volume of the buffer is reduced to about 1 ml or less per mm 2. Probe concentrations and hybrid reaction conditions used are the same as previously described, except that the wash buffer is poured quickly over an array of subarrays to quickly dilute the probes to prevent cross-hybrid reactions. For the same reason, use a minimum concentration of probes and the hybrid start extends to the maximum level. For DNA detection and sequencing, knowledge of the "normal" sequence is used, and a continuous stacking interaction phenomenon is used to increase the signal. In addition to the labeled probes, an unlabeled probe is added that is back to back hybrid with the labeled in the hybrid reaction. The amount of hybrid is increased several times. Probes are linked by ligation. This method is important for unpacking the "compressing" parts of DNA.
방사능라벨된 프로브의 경우에, 인산저장 기술을 이용하여 필터의 상을 적절하게 얻을 수 있다. CDC 카메라, 공촛점 카메라 또는 다른 것을 이용하여 형광 라벨을 기록한다. 다른 하이브리드 실험에서 얻은 데이터를 적절히 버리고 합체하기 위해 실제 시그날은 각 도트에서 표적량에 기초하여 표준화한다. 도트당 표적 DNA의 양이 차이가 있는 것은 각 프로브의 시그날을 모든 프로브에 대한 평균 시그날로 나누어 보정한다. 표준화된 시그날은 다른 실험에서 얻은 데이터와 비교하여 1-100으로 분류한다. 각 서브배열에서, 몇 가지 기준 DNA를 이용하여 완전하게 짝을 이루는 표적을 포함하지 않는 샘플에 있는 배경 시그날의 평균을 측정한다. 이중 등급(다중 등급)을 가지는 샘플의 경우에, 상동 기준을 이용하여 샘플에 이형성을 인지할 수 있다.In the case of radiolabeled probes, phosphate storage techniques can be used to obtain the filter phase appropriately. Record the fluorescent label using a CDC camera, a confocal camera, or others. To properly discard and coalesce data from other hybrid experiments, the actual signal is normalized based on the target amount at each dot. The difference in the amount of target DNA per dot is corrected by dividing the signal of each probe by the average signal for all probes. Standardized signals are classified 1-100 in comparison with data obtained from other experiments. In each subarray, several reference DNAs are used to determine the mean of the background signal in the sample that does not contain a fully paired target. In the case of samples with dual grades (multiple grades), homology criteria can be used to recognize dysplasia in the sample.
실시예 10 ; 올리고뉴클레오티드와 하이브리드 반응Example 10; Oligonucleotides and Hybrid Reactions
Genosys Inc., Houston, Texas로부터 올리고뉴클레오티드를 구입하고, Applied Biosystems 381A DNA 합성기를 이용하여 합성하였다. 이용된 대부분의 프로브는 HPLC 또는 겔 전기영동을 이용하여 정제하지 않았다. 예를 들면, 프로브는 인터페론에 있는 완전하게 상보적인 표적, 921bp Eco RI-Bgl II 사람 B1-인터페론 단편(Ohno and Tangiuchi, Proc. Natl. Acad. Sci. 74: 4370-4374 (1981))을 포함하는 M13 클론 및 M13 벡터 자체에 한 개 염기 미스메취를 가지는 적어도 한 개 표적을 모두 가지도록 고안하였다.Oligonucleotides were purchased from Genosys Inc., Houston, Texas and synthesized using an Applied Biosystems 381A DNA synthesizer. Most of the probes used were not purified using HPLC or gel electrophoresis. For example, probes include a completely complementary target in interferon, a 921 bp Eco RI-Bgl II human B1-interferon fragment (Ohno and Tangiuchi, Proc. Natl. Acad. Sci. 74: 4370-4374 (1981)). The M13 clone was designed to have at least one target with one base mismatch in the M13 vector itself.
올리고뉴클레오티드의 말단 라벨링은 Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labortory Cold Spring Harbor, New York (1982)에서 설명하고 있는 것과 같이 T4-폴리뉴클레오티드 카이네이즈(5units Amersham), g32P-ATP(3.3 pM, 10 mCi Amersham 3000 Ci/mM), 올리고뉴클레오티드(4pM, 10 ng)을 포함하는 10㎖에서 실시한다. 프로브의 특이 활성은 2.5-5 X 109cpm/nM이다.Terminal labeling of oligonucleotides is described in Maniatis et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labortory Cold Spring Harbor, New York (1982), T4-polynucleotide kinase (5units Amersham), g 32 P -10 ml containing ATP (3.3 pM, 10 mCi Amersham 3000 Ci / mM), oligonucleotides (4 pM, 10 ng). Specific activity of the probe is 2.5-5 × 10 9 cpm / nM.
동일한 용액으로 적신 Gene Screen 막 위에서 단일 가닥 DNA(2 내지 4㎖/0.5 NaOH, 1.5M NaCl)을 스팟하고, 필터는 0.05M Na2HPO4pH 6.5로 중화시키고, 60분간 80℃에서 오븐에 둔 후, 1분간 UV를 방사한다. 그 다음 필터는 하이브리드 용액(0.5 M Na2HPO4pH 7.2), 7% 라우릴 사르코신 나트륨에 실온에서 5분간 배양하고, 플라스틱 배양접시 표면에 둔다. 4nM 농도에서32P-말단 라벨된 올리고머 프로브를 가지는 하이브리드 용액(10㎖ 0.5 M Na2HPO4pH 7.2, 7% 라우릴 사르코신 나트륨) 한 반울을 필터한개당 1-6개 도트위에 둔 다음 폴리에틸렌 사각 피스(약 1 X 1 ㎝)를 덮고, 3시간동안 지적한 온도의 습윤실에서 배양한다. 하이브리드안된 프로브를 제거하기 위해 0℃에서 5분간 3회(3 X 5) 6X SSC 세척 용액에 필터를 위치시켜, 하이브리드 반응을 종료한다. 그 다음 필터는 건조시키거나 지시한 시간 및 온도에서 추가 세척하고, 방사능사진[phosphoimager (Molecular Dynamics, Sunnyvale, California)]을 찍는다. 식별 측정을 위해, 방사능사진을 찍은 후에, 건조된 필터에서 도트를 잘라내어, 액체 신틸레이션 칼테일에 넣고, 카운터한다. IF와 M13 도트에 대한 cpm 보정안된 비율은 D로 한다.Spot single stranded DNA (2-4 mL / 0.5 NaOH, 1.5 M NaCl) on a Gene Screen membrane moistened with the same solution, filter neutralized to 0.05 M Na 2 HPO 4 pH 6.5 and placed in an oven at 80 ° C. for 60 min. Afterwards, UV is emitted for 1 minute. The filter is then incubated in hybrid solution (0.5 M Na 2 HPO 4 pH 7.2), 7% sodium lauryl sarcosine for 5 minutes at room temperature, and placed on a plastic dish surface. A drop of hybrid solution (10 mL 0.5 M Na 2 HPO 4 pH 7.2, 7% sodium lauryl sarcosine sodium) with 32 P-terminal labeled oligomer probes at 4 nM concentration was placed on 1-6 dots per filter and then Cover the piece (approximately 1 × 1 cm) and incubate in a wet room at the indicated temperature for 3 hours. The filter is placed in a 3 × 5 6 × SSC wash solution three times for 5 minutes at 0 ° C. to remove the unhybridized probe, ending the hybrid reaction. The filter is then dried or further washed at the indicated time and temperature and taken radiophotor (phosphoimager (Molecular Dynamics, Sunnyvale, California)). For identification measurements, after taking a radiograph, the dots are cut out of the dried filter, placed in a liquid scintillation caltail, and countered. The cpm uncorrected ratio for the IF and M13 dots is D.
여기에서 보고한 조건은 매우 짧은 올리고뉴클레오티드를 하이브리드하게 하나, 표적 핵산에 상보적이면서 이에 결합하는 짝을 이룬 올리고뉴클레오티드와짝을 잘못이룬(mismatch) 올리고뉴클레오티드를 식별할 수 있도록 한다. 하이브리드에서 완전하게 상보적인 표적과 한 개의 미스메취를 가지는 불완전한 상보 표적간에 식별 정도(D)에 기초하여, 특정 짧은 서열의 하이브리드를 효과적으로 감지하는데 영향을 주는 인자로 정의된다. 실험 테스트에서, 길이가 6 내지 8개 뉴클레오티드의 28개 프로브를 두 개 M13 클론에 도트 블랏 하이브리드시키거나 또는 막 필터에 결합된 모델 올리고뉴클레오티드에 하이브리드시시켰다. 실험 과정을 주도하는 원리는 다음과 같다.The conditions reported here allow for the hybridization of very short oligonucleotides but for the identification of mismatched oligonucleotides with paired oligonucleotides that are complementary to and bind to the target nucleic acid. Based on the degree of identification (D) between a completely complementary target in a hybrid and an incomplete complementary target with one mismatch, it is defined as a factor that affects the effective detection of a hybrid of a particular short sequence. In experimental tests, 28 probes of 6-8 nucleotides in length were dot blotted hybridized to two M13 clones or hybridized to model oligonucleotides bound to membrane filters. The principle driving the experimental process is as follows.
과량의 프로브가 있는 조건하에서 프로브보다 몇 개 뉴클레오티드가 더 긴 결합된 표적 핵산을 여과하는 올리고뉴클레오티그 하이브리드 반응은 표적 농도에 대해 모의 1차 반응이 된다. 이 반응은 다음과 같다.The oligonucleotide hybrid reaction, which filters bound target nucleic acids several nucleotides longer than the probe under conditions with excess probes, becomes a simulated primary response to target concentrations. This reaction is as follows.
St/So= e-kh[OP]t S t / S o = e -kh [OP] t
이때, St와 So는 t 및 to시간에 표적 서열 농도를 나타낸다. (OP)는 프로브 농도이고, t는 온도를 나타낸다. 하이브리드 형성의 속도 상도, kh는 0℃ 내지 30℃범위에서 약간 증가된다(Porschke and Eigen, J. Mol. Biol. 62: 361(1974); Craig et al., J. Mol. Biol. 62: 383 (1971)). 하이브리드 용융은 다음에 나타낸 것과 같이 하이브리드 농도에 대해 1차 반응이 된다;In this case, S t and S o represent target sequence concentrations at t and t o time. (OP) is the probe concentration and t represents the temperature. The rate phase of hybrid formation, k h, is slightly increased in the range of 0 ° C. to 30 ° C. (Porschke and Eigen, J. Mol. Biol. 62: 361 (1974); Craig et al., J. Mol. Biol. 62: 383 (1971)). Hybrid melting is a first order reaction to hybrid concentration as shown below;
Ht/Ho= e-kmt H t / H o = e -kmt
이 식에서, Ht및 Ho는 t 및 to시간에 하이브리드 농도를 각각 나타내고; km은 온도 및 염 농도에 따른 하이브리드 용융 속도 상수이다[Ikuta et al., Nucl. Acids Res. 15: 797 (1987); Porsclike and Eigen, J. Mol. Biol. 62: 361 (1971); Craig et al., J. Mol. Biol. 62: 303 (1971)]. 가닥이 연합되는 공정인 하이브리드 반응 동안에, 역 용융 또는 가닥 분리 반응이 일어난다. 따라서, 시간 내에 형성되는 하이브리드 양은 전-반응 및 역-반응 결과를 나타낸다. 프로브 농도를 증가시키거나 온도를 감소시키면 하이브리드 형성 쪽으로 평형이 이동된다, 그러나, 상당량의 완충액에서 세척 과정동안에 용융 반응이 우세하고, 역 반응 하이브리드가 약하게 되는데, 그 이유는 프로브가 없기 때문이다. 이와 같은 분석 결과는 프로브 농도 또는 온도에 대해 작업 가능한 짧은 올리고뉴클레오티드 하이브리드 조건(SOH)이 다양하다는 것을 나타낸다.In this formula, H t and H o represent hybrid concentrations at t and t o times, respectively; k m is a hybrid melt rate constant with temperature and salt concentration [Ikuta et al., Nucl. Acids Res. 15: 797 (1987); Porsclike and Eigen, J. Mol. Biol. 62: 361 (1971); Craig et al., J. Mol. Biol. 62: 303 (1971). During the hybrid reaction, a process in which the strands are associated, a reverse melting or strand separation reaction occurs. Thus, the hybrid amount formed in time represents the pre-reaction and reverse-reaction results. Increasing the probe concentration or decreasing the temperature shifts the equilibrium towards hybrid formation, but the melt reaction prevails during the washing process in a significant amount of buffer and the reverse reaction hybrid is weak because there is no probe. These assay results indicate that short oligonucleotide hybrid conditions (SOH) that can work on probe concentration or temperature vary.
다음의 식에서 D 또는 식별에 대해 정의한다;Define for D or identification in the following formula;
D = Hp(tw) / Hi(tw)D = H p (t w ) / H i (t w )
Hp(tw) 및 Hi(tw)는 완전한 상보적인 이중나선 및 불완전한 상보 이중나선이 각 동일한 양의 경우에 세척 시간(tw)동안에 남아있는 하이브리드 양을 말한다. 주어진 온도에서, 식별 D는 세척 시가에 10 배 길이로 변화되고, Hi= B인 경우(식 5)에 최대치에 도달한다.H p (t w ) and H i (t w ) refer to the amount of hybrid that the fully complementary double helix and the incomplete complementary helix remain during the washing time (t w ) for each equal amount. At a given temperature, identification D changes 10 times the length of the wash time and reaches a maximum when H i = B (Equation 5).
배경 B는 시스템에서 감지할 수 있는 최저 하이브리드 시그날을 나타낸다. Hi의 임의 추가 감소에 대해 검사하지 않았기 때문에, D는 지속적인 세척에 따라 증가한다. tw를 지난 세척은 B에 대해 Hp를 감소시키고, 이는 D가 감소되는 것으로 볼 수 있다. 식 3과 식 5로부터 불완전한 하이브리드의 경우에 최적 세척 시간 tw는 다음과 같다;Background B represents the lowest hybrid signal the system can detect. Since no further reduction in H i was examined, D increases with continuous washing. A wash past t w decreases H p over B, which can be seen to decrease. For incomplete hybrids from equations 3 and 5 the optimal wash time t w is as follows;
tw= -ln (B / Hi(T0)) / Km.i t w = -ln (B / H i (T 0 )) / K mi
Hp는 동일한 tw동안 세척되기 때문에, 식을 복합하여, 최적의 식별 함수를 다음과 같이 얻을 수 있다;Since H p is washed for the same t w , the formula can be combined to obtain the optimal identification function as follows;
D = eln (B/Hi (t0) km,p /km,iX Hp(t0) / BD = e ln (B / Hi (t0) km, p / km, i XH p (t 0 ) / B
최적의 세척 온도를 선택하기 때문에 T에 대한 함수로써 D의 변화가 중요하다. 이는 다음의 Arhenius 식(K- = Ae- Ea / RT)을 기존의 식에 대체하여 최종 식을 얻을 수 있다;The change in D as a function of T is important because it selects the optimum wash temperature. It is possible to obtain the final equation by substituting the following Arhenius equation (K- = Ae -Ea / RT ) for the existing equation;
D = Hp((t0)/B X (B/Hi(t0))(Ap / Ai) e (Ea,i- Ea,p)/RT;D = H p ((t 0 ) / BX (B / H i (t 0 )) (Ap / Ai) e (E a, i -E a, p ) / RT ;
이때, B는 Hi(t0)보다는 적다.At this time, B is less than H i (t 0 ).
완전한 하이브리드의 활성 에너지, Ea,p와 불완전한 하이브리드의 활성 에너지, Ea,i는 동일하거나 또는 Ea,i가 Ea,p보다 적을 수 있기 때문에, D는 온도와는 무관하거나 또는 온도가 증가함에 따라 감소될 수 있다. 이 결과는 SOH에서 양호한 식별을 위한 엄격한 온도 조건을 조사하는데 적합하지 않다는 것을 말한다. 낮은 온도에서 세척하는 경우에, 동일한 또는 더 나은 식별을 할 수 있으나, 세척온도는 온도가 감소함에 따라 지수적으로 증가된다. Hi(t0)가 Hp(t0)에 대해 증가되면 식별은 T에 따라 매우 강하게 감소된다.Since the active energy of a complete hybrid, E a, p and the active energy of an incomplete hybrid, E a, i can be the same or E a, i can be less than E a, p , D is independent of temperature or temperature Can decrease with increasing. This result suggests that it is not suitable for investigating stringent temperature conditions for good identification in SOH. In the case of washing at lower temperatures, the same or better identification can be made, but the washing temperature increases exponentially with decreasing temperature. If H i (t 0 ) is increased for H p (t 0 ), the identification decreases very strongly with T.
낮은 온도에서 D는 Hp(t0) / Hi(t0)보다는 Hp(t0)/B 비율에 대해 더 많이 의존하게 된다. 이 결과는 이 단계에서 얻을 수 있는 식별과는 무관하게 하이브리드 반응에서 충분한 정도의 양 Hp를 얻을 수 있다는 것을 말한다. 완전한 하이브리드 양을 많으면, 효과를 나타내기 위한 차등 용융 시간을 더 많이 해야 한다. 유사하게, 더 많은 양의 표적 핵산을 이용하면, Km,p과 Km,i간에 차이가 적은 경우에도 필요한 식별을 얻을 수 있다.At lower temperatures, D depends more on the H p (t 0 ) / B ratio than on H p (t 0 ) / H i (t 0 ). This result indicates that a sufficient amount of H p can be obtained in the hybrid reaction regardless of the identification obtained at this stage. Larger amounts of complete hybrids require more differential melting times to be effective. Similarly, using a larger amount of target nucleic acid can provide the necessary identification even when the difference between K m, p and K m, i is small.
이와 같은 간단한 모델에서 수용하는 것 이상의 좀더 복잡한 상황으로 추정하면, 그 결과에 따르면, 주어진 핵산 표적 내에 말단 미스메취(mismatch)가 많이 있는 프로브의 하이브리드 경우에 식별을 하기 위해서는 저온에서 세척하는 것이 중요하다.Given a more complex situation than this simple model would accept, the results show that it is important to wash at low temperatures to identify hybrid cases of probes with many terminal mismatches in a given nucleic acid target. .
실험을 위한 안내로써 설명된 이론적인 원리를 이용하여, 길이가 6 내지 8개 뉴클레오티드를 가진 프로브를 이용하면, 신뢰성있는 하이브리드를 얻을 수 있다. 모든 실험은 필터위세 하이브리드 용액 필름을 제공하는 부유 플라스틱 쉬트를 이용하여 실행한다. 이와 같은 과정은 프로브 양을 최대로 줄일 수 있게 하여, 도트 블랏 하이브리드 반응에 라벨 비용을 줄일 수 있다. 하이브리드 인산 완충액에 라우릴 설페이트 나트륨대신에 라우릴 사르코신 나트륨을 고농도로 이용하면, 반응 온도를 실온에서 12℃로 떨어뜨릴 수 있다. 유사하게, 4-6 X SSC, 10% 라우릴 사르코신 나트륨 완충액을 이용하면, 2℃와 같은 낮은 온도에서도 하이브리드 반응을 할 수 있다. 이와 같은 완충액에 있는 계면활성제는 라벨된 프로브의 농도가 최고 40nM까지 수용할 수 있는 배경을 제공한다. 짧은 올리고뉴클레오티드의 열에 대한 안정성은 50% G+C를 가지는 프로토타입 가령, 프로브 서열이 TGCTCATG인 옥타머에서 미리 조사할 수 있다. 이의 전이 엔탈피는 좀더 안정한 헵타머 또는 길이가 6개 뉴클레오티드인 것의 엔탈피와 유사하다(Bresslauer et al., Proc. Natl. Acad. Sci. U.S.A. 83: 3746 (1986)). 분 단위에 하이브리드의 50%가 용융되는 시점의 온도 변수 Td는 18℃이다. 결과에서는 11bp 이중나선보다는 8bp인 하이브리드의 경우에 Td가 15℃로 더 낮다[Wallace et al., Nucleic Acids Res. 6: 3543 (1979)].Using the theoretical principles described as a guide for experiments, using probes with 6 to 8 nucleotides in length can yield reliable hybrids. All experiments were performed using a suspended plastic sheet providing a filter-topped hybrid solution film. This process can reduce the amount of probe to the maximum, thereby reducing the labeling cost of the dot blot hybrid reaction. Using high concentrations of lauryl sarcosine sodium in place of lauryl sulfate sodium in the hybrid phosphate buffer can reduce the reaction temperature from room temperature to 12 ° C. Similarly, using 4-6 X SSC, 10% lauryl sarcosine sodium buffer, hybrid reactions can be performed at low temperatures such as 2 ° C. Surfactants in such buffers provide a background that can accommodate concentrations of labeled probes up to 40 nM. Stability to the columns of short oligonucleotides can be previously investigated in prototypes with 50% G + C, such as octamers with probe sequence TGCTCATG. Its transition enthalpy is similar to the more stable heptamer or enthalpy of 6 nucleotides in length (Bresslauer et al., Proc. Natl. Acad. Sci. USA 83: 3746 (1986)). The temperature variable T d at the time when 50% of the hybrid melts in minutes is 18 ° C. The results show that for hybrids with 8bp rather than 11bp double helix, T d is lower to 15 ° C [Wallace et al., Nucleic Acids Res. 6: 3543 (1979).
모델 올리고뉴클레오티드와 실험한 것에 추가하여, M13 벡터를 짧은 올리고뉴클레오티드의 하이브리드 반응을 설명하는 시스템으로 선택하였다. 주요 목표는 본 발명의 다양한 방법에 이용할 수 있는 것과 유사한 표적간에 유용한 말단-미스메취(mismatch) 식별을 제공하는 것이다. M13 모델 자체에 말단 미스메취(mismatch) 염기를 포함하기 때문에 M13 모델의 올리고뉴클레오티드 프로브를 선택하였다. 921bp 사람 인터페론 유전자 삽입체를 포함하는 M13 재조합체인 벡터는 한 개의 완전한 짝을 이룬 표적을 운반한다. 따라서, IF가 M13 벡터 자체와 비교하였을 때, 동일한 또는 더 많은 수의 미스메취(mismatch) 표적을 가진다.In addition to experimenting with model oligonucleotides, the M13 vector was chosen as a system to describe the hybrid reaction of short oligonucleotides. The main goal is to provide useful end-mismatch identification between similar targets that may be used in the various methods of the present invention. Oligonucleotide probes of the M13 model were chosen because they contain terminal mismatch bases in the M13 model itself. The vector, an M13 recombinant comprising a 921 bp human interferon gene insert, carries one complete paired target. Thus, IF has the same or more mismatch targets when compared to the M13 vector itself.
저온 조건 및 도트 블랏을 이용하여, 완전한 표적 및 미스메취(mismatch)된 표적을 가지는 도트와 미스메취(mismatch) 표적만을 가지는 도트사이에 하이브리드 스그날의 차이를 얻을 수 있다. 이는 6-mer 올리고뉴클레오티드의 경우에는 맞고, IF-M13 거대한 핵산 쌍에 하이브리드된 7 및 8-mer 올리고뉴클레오티드의 경우에도 맞다.Cold conditions and dot blots can be used to obtain a hybrid sig- nal difference between a dot with a complete target and a mismatched target and a dot with only a mismatch target. This is true for 6-mer oligonucleotides and for 7 and 8-mer oligonucleotides hybridized to IF-M13 large nucleic acid pairs.
하이브리드 반응 시그날은 프로브와 반응을 하는 필터에서 이용할 수 있는 표적의 양에 따라 달라진다. 사인 강도의 차이는 두 개 도트에 있는 다양한 핵산 양을 반영하지 않는다는 것을 보여준다. IF와 M13 모두에서 동일한 수와 동일한 종류의 표적을 가지는 프로브와 하이브리드 반응하면, 도트에 동일한 양의 DNA를 가진다는 것을 알 수 있다. 하이브리드 형성 효과는 하이브리드 길이에 따라 증가되어, 6개 뉴클레오티드를 가지는 이중나선의 경우에 시그날은 필터에 결합된 올리고뉴클레오티드 표적의 양이 높을 때 가장 잘 감지된다. 분자량이 낮기 때문에, 표적으로 작용하는 큰 분자의 핵산과 비교하였을 때, 더 많은 수의 올기고뉴클레오티드 표적 분자가 주어진 표면에 결합할 수 있다.Hybrid reaction signals depend on the amount of target available in the filter that reacts with the probe. The difference in sine intensity does not reflect the varying amounts of nucleic acid in the two dots. Hybrid reactions with probes having the same number and the same kind of targets in both IF and M13 show that the dots have the same amount of DNA. The hybridization effect increases with hybrid length, so that in the case of a double helix having six nucleotides, the signal is best detected when the amount of oligonucleotide target bound to the filter is high. Because of their low molecular weight, larger numbers of oligonucleotide target molecules can bind to a given surface as compared to the larger molecules of nucleic acid that act as targets.
정제안된 DNA를 감지하는 감도를 측정하기 위해, 다양한 양의 파아지 상청액을 필터에 스팟하고,32P-라벨된 옥타머와 하이브리드 반응을 시킨다. 0.5ng DNA를 포함하는 5000만 정제안된 파아지의 경우에도 감지가능한 시그날을 제공하는데, 이는 짧은 올리고뉴클레오티드 하이브리드 반응 방법의 감응성이 충분하다는 것을 나타낸다. 반응 시간은 짧다.To measure the sensitivity of detecting unpurified DNA, various amounts of phage supernatant are spotted on the filter and hybridized with 32 P-labeled octamers. Even 50 million unpurified phages containing 0.5 ng DNA provide a detectable signal, indicating that the sensitivity of the short oligonucleotide hybrid reaction method is sufficient. The reaction time is short.
상기 이론 부분에서 언급한 것과 같이, 하이브리드의 평형 수득율은 오일 프로브 농도 및 반응 온도에 따라 달라진다. 예를 들면, 13℃에서 4nM 옥타머와 동량의 표적의 경우에 시그날 수준은 40nM 프로브 농도의 경우보다 3배 낮고, 하이브리드 반응 온도를 25℃로 올리면 4.5배 감소한다.As mentioned in the theoretical section above, the equilibrium yield of the hybrid depends on the oil probe concentration and the reaction temperature. For example, for targets of the same amount as 4 nM octamers at 13 ° C., the signal levels are three times lower than for 40 nM probe concentrations and decrease 4.5 times as the hybrid reaction temperature is raised to 25 ° C.
최대로 식별을 하기 위한 저온 세척을 이용하는 것을 설명하였다. 시각적으로 분명하게 하기 위해, 벡터 특이적인 프로브와 함께 하이브리드 반응을 이용하여 IF 도트보다 M13 도트에 50배 DNA를 넣는다. 이와 같은 방법으로, 실제 프로브와 하이브리드 반응 후에 시그날은 짝을 이룬 경우보다 미스메취(mismatch)된 경우에 더 강하게 나타난다. Hp/Hi비율은 1:4이다. 7℃에서 세척을 연장하였을 경우에, 완전한 하이브리드의 양적 손실 없이, 시그날 강도가 2:1 정도로 역전된다. 대조적으로, 25℃에서 임의 식별을 하는 것이 불가능한데, 그 이유는 짝을 이룬 표적 시그날이 2분 세척 후에 배경 수준으로 내려갔고; 동시에, 미스메취(mismatch)된 하이브리드의 시그날은 여전히 감지할 수 있는 것이기 때문이다. 7℃와 비교하였을 경우에 13℃에서 식별 손실양은 크기 않아 분명하게 볼 수 있다. 미스메취(mismatch)된 하이브리드 시그날이 배경 수준에 근접하였을 때, 7℃에서 90분, 13℃에서 15분이 각 조건에서 최적의 세척시간이라고 간주하였을 경우에, 13℃ 보다는 7℃에서 몇 배 더 크다는 것이 분명하게 나타난다. 이를 추가 설명하기 위해, 두 개 온도에서 동량의 출발 하이브리드를 세척하는데 있어서, 시간에 따른 식별 정도의 변화에서 온도가 낮을 때 더 높은 최대 D를 나타내었다. 이와 같은 결과는 세척 단계 시작 시에 두 가지 타입의 하이브리드 비율과 온도에 따라 D가 변화되는 경향이 있다는 것을 확인하였다.The use of cold washes for maximum identification has been described. For visual clarity, 50 times DNA is placed in the M13 dot than the IF dot using a hybrid reaction with a vector specific probe. In this way, after hybrid reactions with real probes, the signal appears stronger when mismatched than when paired. The H p / H i ratio is 1: 4. If the wash was extended at 7 ° C., the signal strength would be reversed by 2: 1, without quantitative loss of the complete hybrid. In contrast, it is not possible to make any identification at 25 ° C., because the paired target signals went down to the background level after a two minute wash; At the same time, the signals of mismatched hybrids are still detectable. Compared with 7 ° C, the loss of identification at 13 ° C is large and can be clearly seen. When the mismatched hybrid signal is close to the background level, 90 minutes at 7 ° C. and 15 minutes at 13 ° C. are several times greater at 7 ° C. than 13 ° C., given the optimum cleaning time for each condition. Is obvious. To further illustrate this, in washing the same amount of starting hybrid at two temperatures, a higher maximum D was shown at lower temperatures in the change of discernment over time. These results confirm that D tends to change with the ratio and temperature of the two types of hybrids at the start of the washing step.
짧은 올리고뉴클레오티드 하이브리드 반응 조건의 일반적인 유용성을 보여주기 위해, 간단한 M13 시스템에서 4개 헵타머, 10개 옥타머, 길이가 최고 12개 뉴클레오티드의 추가 14개 프로브의 하이브리드 반응을 조사하였다. 여기에는 GC 함량이 두 개가 극단적인 9mer GTTTTTTAA 및 8-mer GGCAGGCG을 포함한다. GC 함량 및 서열이 짧은 하이브리드의 안정성에 영향을 줄 것으로 예측되지만[Bresslauer et al., Proc. Natl. Acad. Sci. U.S.A. 83: 3746 (1986)], 충분한 식별을 얻기 위해, 낮은 온도의 짧은 올리고뉴클레오티드 조건을 테스트되는 모든 프로브에 적용할 수 있다. 길이기 13개인 뉴클레오티드 프로브에서 얻은 식별 값이 가장 좋은 20이기 때문에, 서열 변화 때문에 몇 배 감소된 것도 용이하게 허용된다.To demonstrate the general utility of short oligonucleotide hybrid reaction conditions, hybrid reactions of four heptamers, ten octamers, and up to twelve nucleotides in length in a simple M13 system were investigated. This includes two extreme GC contents, the 9mer GTTTTTTAA and the 8-mer GGCAGGCG. Although GC content and sequence are expected to affect the stability of short hybrids [Bresslauer et al., Proc. Natl. Acad. Sci. U.S.A. 83: 3746 (1986)], in order to obtain sufficient identification, low temperature short oligonucleotide conditions can be applied to all probes tested. Since the identification value obtained with a 13 nucleotide probe of length 20 is the best 20, it is easily acceptable to be reduced several times due to sequence changes.
M13 시스템은 식별 수준에서 표적 DNA 복합성의 영향에 대해 보여주는 장점이 있다. 미스메취(mismatch)된 표적이 없거나 5개 미스메취(mismatch)된 표적을 가지고, 단지 한 개 GC 쌍이 차이가 있는 두 개 옥타머에서, 관찰된 식별 값은 18.3 및 1.7이다.The M13 system has the advantage of showing the effect of target DNA complexity on the level of identification. In two octamers with no mismatched targets or with five mismatched targets and only one GC pair is different, the observed identification values are 18.3 and 1.7.
이 방법의 유용성을 나타내기 위해, 길이가 8개 뉴클레오티드인 프로브를 Bluescript vector에 있는 라이브러리에서 만든 51개 플라스미드 DNA 도트 수집에서 테스트하였다. Bluescript 벡터에 특이적인 한 개 프로브가 있고, M13에는 없으며, 다른 두 개 프로브는 공지 서열의 삽입체인 표적을 가진다. 이와 같은 시스템으로 각 프로브와 함께 하이브리드 반응 음성 또는 양성 기준 DNA를 이용하도록 한다. 이 프로브 서열(CTCCCTTT)은 인터페론 삽입체에 있는 상보적인 표적을 가진다. M13 도트가 음성이고, M13 또는 Bluescript에 있는 인터페론 삽입체가 양성이기 때문에, 하이브리드 반응은 서열 특이적이다. 유사하게, 클론에 적절한 표적이 존재하는 경우에, 하이브리드 반응을 확인하기 위해, 51개 삽입체중 한 개 에서만 표적 서열을 감지하는 또는 기준과 함께 검사된 삽입체중 어느 것에서도 표적 서열을 감지하지 못한 프로브가 발생할 수 있다.To demonstrate the utility of this method, a probe of 8 nucleotides in length was tested on 51 plasmid DNA dot collections made from a library in a Bluescript vector. There is one probe specific for the Bluescript vector, not in M13, and the other two probes have a target that is an insert of a known sequence. Such a system allows the use of hybrid reaction negative or positive reference DNA with each probe. This probe sequence (CTCCCTTT) has a complementary target in the interferon insert. Hybrid reactions are sequence specific because the M13 dot is negative and the interferon insert in M13 or Bluescript is positive. Similarly, in the presence of an appropriate target in the clone, a probe that either detects the target sequence only in one of the 51 inserts or does not detect the target sequence in any of the inserts tested with the criteria to confirm the hybrid response. May occur.
길이가 6-8개 뉴클레오티드인 매우 짧은 올리고뉴클레오티드에 대한 열 안정도 곡선은 길이가 11-12개 뉴클레오티드인 하이브리드의 경우보다 적어도 15℃ 정도 낮다[Fig. 1 and Wallace et al., Nucleic Acids Res. 6: 3543-3557 (1979)]. 그러나, 저온에서 그리고 매우 다양한 올리고뉴클레오티드 농도 0.4-40에서 하이브리드 반응을 실행하면, 공지의 또는 미지의 핵산 표적에서 상보적인 서열을 감지할 수 있다. 완전하게 미지의 핵산 서열을 결정하기 위해, 65,535개 8-mer 프로브를 포함하는 전체 세트를 이용할 수 있다. M13 배양물의 수십 ㎕, 박테리아 배양물 또는 단일 콜로니 박테리아 10㎖으로부터 플라스미드 준비물 또는 표준 PCR 반응 1㎖미만등의 통상 생물학적 샘플에는 이 목적을 위한 충분한 양의 핵산이 존재한다.The thermal stability curves for very short oligonucleotides of 6-8 nucleotides in length are at least 15 ° C lower than for hybrids of 11-12 nucleotides in length [Fig. 1 and Wallace et al., Nucleic Acids Res. 6: 3543-3557 (1979). However, hybridization at low temperatures and at a wide variety of oligonucleotide concentrations of 0.4-40 can detect complementary sequences at known or unknown nucleic acid targets. To determine fully unknown nucleic acid sequences, a full set comprising 65,535 8-mer probes can be used. Sufficient nucleic acid is present for this purpose in conventional biological samples such as dozens of [mu] l of M13 culture, bacterial culture or plasmid preparation from 10 ml of single colony bacteria or less than 1 ml of standard PCR reaction.
6-10개 뉴클레오티드 길이의 짧은 올리고뉴클레오티드가 우수한 식별을 제공한다. 한 개 말단 미스메취(mismatch)를 가지는 경우 하이브리드의 경우에 더 긴 프로브 보다 안정성이 상대적인 더 크게 감소된다. 옥타머 TGCTCATG를 이용한 결과는 이와 같은 결론을 기원한다. 실험에서 G/T 말단 미스메취(mismatch)가 있는 표적의 경우에, 미스메취(mismatch) 타입 표적에 하이브리드하는 것이 다음 모든 타입의 올리고뉴클레오티드에서 가장 안정하다. 이와 같은 식별은 19개 염기쌍 이중 나선에서 내부 G/T 미스메취(mismatch)보다 더 크거나 동일하다[Ikuta et al., Nucl. Acids res. 15: 797 (1987)]. 짧은 올리고뉴클레오티드 하이브리드 반응에 대한 설명한 하이브리드 반응 조건을 이용한, 이와 같은 식별 성질을 이용하면, 매우 정확하게 올리고뉴클레오티드 표적을 결정할 수 있다. 완전한 하이브리드와 불완전한 하이브리드간에 식별 감지가 용이한 것과는 대조적으로, 매우 짧은 올리고뉴클레오티드를 이용할 경우에 문제점은 충분한 양의 하이브리드를 준비하는 것이다. 실제, 도트에서 DNA 양을 증가시키거나 프로브 농도를 증가시키거나 또는 하이브리드 반응 온도를 감소시켜, Hp와 Hi를 식별하는데 도움을 받을 수 있다. 그러나, 프로브 농도를 더 높일 경우에 배경이 증가된다. 또한, 실제 이용할 수 있는 표적 핵산의 양에도 제한을 받는다. 4nM 프로브의 경우에 효과적인 배경을 제공하는 계면활성제 사르코실 농도를 높여서, 이 문제를 해결할 수 있다. 또한, 필터에 프로브가 비특이적으로 결합시키기 위한 경쟁물질 이용 또는 하이브리드 반응 서포트 재질 변경 등을 이용하여 개선할 수 있다. Ea가 45Kcal/mol(많은 헵타머 및 대부분 헥사머의 경우) 이하인 프로브의 경우에, 변형된 올리고뉴클레오티드가 변형안된 짝보다는 좀더 안정한 하이브리드를 제공한다[Asseline, et al., Proc. Nat'l Acad. Sci. 81: 3297 (1984)]. 본 발명에서 저온을 이용한 짧은 올리고뉴클레오티드 하이브리드 반응을 위해 설명하는 하이브리드 반응 조건은 모든 서열 및 이중 나선 하이브리드 제공물에 대해 우수한 식별을 제공한다. 상이한 서열에 대해 하이브리드 반응 조건에서 균일성을 얻는데 소요되는 비용만은 서열에 따라 최고 24시간의 세척 시간에서 증가된다. 또한, 세척 시간은 염 농도를 줄이면 추가 감소시킬 수 있다.Short oligonucleotides of 6-10 nucleotides in length provide good identification. Having a single terminal mismatch reduces the stability relative to the longer probe than the longer probe in the case of hybrids. The results with octamer TGCTCATG wish this conclusion. In the case of targets with G / T terminal mismatches in the experiment, hybridization to mismatch type targets is most stable for all of the following types of oligonucleotides. This identification is greater than or equal to the internal G / T mismatch in the 19 base pair double helix [Ikuta et al., Nucl. Acids res. 15: 797 (1987). Using such identification properties, using the described hybrid reaction conditions for short oligonucleotide hybrid reactions, oligonucleotide targets can be determined with great accuracy. In contrast to the ease of identification detection between complete and incomplete hybrids, the problem with using very short oligonucleotides is preparing a sufficient amount of hybrid. Indeed, increasing the amount of DNA in the dots, increasing the probe concentration, or decreasing the hybrid reaction temperature can help to identify H p and H i . However, increasing the probe concentration further increases the background. In addition, the amount of target nucleic acid that can be actually used is limited. This problem can be solved by increasing the surfactant sarcosyl concentration, which provides an effective background for 4 nM probes. In addition, it may be improved by using a competition material or a hybrid reaction support material change for non-specifically binding the probe to the filter. For probes with E a below 45 Kcal / mol (for many heptamers and mostly hexamers), modified oligonucleotides provide a more stable hybrid than an unmodified pair [Asseline, et al., Proc. Nat'l Acad. Sci. 81: 3297 (1984). The hybrid reaction conditions described for short oligonucleotide hybrid reactions at low temperature in the present invention provide good identification for all sequences and double helix hybrid offerings. Only the cost of achieving uniformity in hybrid reaction conditions for different sequences is increased at up to 24 hours of wash time depending on the sequence. In addition, the wash time can be further reduced by reducing the salt concentration.
미스메취(mismatch)된 하이브리드중에서 한 개 메취된 하이브리드를 바로 식별할 수 있지만, 짧은 올리고뉴클레오티드 하이브리드 반응의 경우에, 미스메취(mismatch)된 하이브리드에서 발생하는 스그날은 단부 미스메취(mismatch)로 인한 것이다. 특정 길이의 프로브로 효과적으로 검사할 수 있는 크기는 제한적이라는 것을 말한다.Although one matched hybrid can be immediately identified among mismatched hybrids, in the case of short oligonucleotide hybrid reactions, the signal that occurs in the mismatched hybrid is due to an end mismatch. will be. This means that the size that can be effectively tested with a specific length of probe is limited.
식별에서 서열 복합성이 주는 영향은 무시할 수 없다. 그러나, 특정한 비-무작위 서열의 경우에 짧은 올리고뉴클레오티드 하이브리드 반응에 의한 서열 정보를 한정하는 경우에, 복잡성의 영향이 더 크고, 이는 표적 길이 비율에 적합한 프로브를 사용하면 해결될 수 있다. 잘못된 역 식별을 제거할 수 있는 단부-미스메취(mismatch)를 가지는 특정 서열이 발생되지 않도록 길이 비율을 선택한다. 결과에 따르면, 각각 0.6, 2.5, 10 kb보다 짧은 표적 핵산 삽입물에 올리고뉴클레오티드 길이가 6, 7, 8개인 프로브를 이용하라고 권한다.The impact of sequence complexity on identification cannot be ignored. However, in the case of defining sequence information by short oligonucleotide hybrid reactions in the case of certain non-random sequences, the effect of complexity is greater, which can be solved by using probes that are appropriate for the target length ratio. The length ratio is chosen so that no particular sequence with end-mismatch can eliminate false inverse identification. According to the results, we recommend using probes with 6, 7, or 8 oligonucleotide lengths in target nucleic acid inserts shorter than 0.6, 2.5, and 10 kb, respectively.
실시예 11 ; DNA 서열화Example 11; DNA sequencing
서브배열은 복제된 서브배열 형으로 배열된 작은 샘플 세트를 효과적으로 서열화하도록 한다; 예를 들면, 64개 샘플은 8 ×8㎜에 배열하고, 16 ×24 서브배열은 15 ×23㎝ 막에 서브배열간에 1㎜ 폭의 공간을 가지도록 복제된다. 몇 가지 레플리카 막이 만들어 질 수 있다. 예를 들면, 3072개 7-mers 보편적인 세트에 있는 프로브는 32개의 96-웰 플레이트에 나누고, 카이네이즈를 이용하여 라벨링한다. 한 개 하이브리드 과정동안에 4개 막을 나란히 처리한다. 각 막에는, 384개 프로브를 기입한다. 하이브리드 반응 강도를 기록하고, 하기와 같은 서열을 합체한다.Subarrays allow for efficient sequencing of small sample sets arranged in replicated subarray forms; For example, 64 samples are arranged at 8 x 8 mm, and 16 x 24 subarrays are replicated on a 15 x 23 cm film with 1 mm width between subarrays. Several replica membranes can be made. For example, probes in 3072 7-mers universal sets are divided into 32 96-well plates and labeled using kinase. Four membranes are processed side by side during one hybrid process. Each film contains 384 probes. The hybrid reaction intensity is recorded and the following sequences are coalesced.
한 개의 샘플 서브배열에 몇 개의 알 수 없는 것이 포함된 경우에, 특히 유사한 샘플을 이용한 경우에, 이전의 기록된 프로브의 결과에 기초하여 선택된 것이면 더 적은 수의 프로브만으로도 충분하다. 예를 들면, 프로브 AAAAAAA가 양성이 아닌 경우에, 8개 겹쳐지는 프로브중의 임의 것이 양성이 될 경우는 적다. AAAAAAA가 양성이면, 두 개 프로브는 양성이다. 이 경우에 서열화 공정은 우선 최소 겹쳐지는 프로브 서브세트를 양성 고정에 하이브리드하고, 고정 순서, 이들 사이에 있는 크기 및 형태에 대해 가장 있을 것 같은 것을 확인하는 프로브를 성공적으로 선택하는 것으로 구성된다. 이와 같은 두 번째 상의 경우에, 2-10개 프로브 풀(pool)을 이용하는데, 이때 프로브는 풀(pool)에 있는 다른 프로브와 함께 양성으로 기대되는 샘플과는 다른 한 개 DNA 샘플에서 양성인 것을 선택한다.In the case where one sample subarray contains several unknowns, especially when similar samples are used, fewer probes are sufficient if they were selected based on the results of the previously recorded probes. For example, if the probe AAAAAAA is not positive, it is rare that any of the eight overlapping probes becomes positive. If AAAAAAA is positive, both probes are positive. In this case, the sequencing process consists of first hybridizing a minimum overlapping probe subset to positive fixation and successfully selecting the probes that identify the most likely for the fixation sequence, the size and shape in between. For this second phase, a pool of 2-10 probes is used, where the probe is chosen to be positive in one DNA sample that is different from the sample expected to be positive with other probes in the pool. do.
서브배열 방식은 분지문제를 해결하는데 있어서, 프로브 경쟁(겹쳐지는 프로브) 또는 프로브 협력(지속적인 프로브 스태킹)을 효과적으로 할 수 있다. 보편적인 프로브 세트의 하이브리드 반응 후에, 서열 합체 프로그램으로 추천된 서열 하위 단편(SFs)을 결정한다. SFs의 추가 합체를 위해, 겹쳐진 DNA 단편 서열, 유사 서열, 단일 패스 겔 서열로부터 EH는 다른 하이브리드 반응 또는 제한 효소 지도 데이터로부터 추가 정보를 제공해야 한다. 분지점을 통하여 단일 패스 겔 서열에 대한 프라이머는 SBH 서열 정보 또는 공지의 다른 벡터 서열로부터 확인할 수 있는데, 예를 들면, 벡터 삽입 부위에 인접한 서열, 표준 Sanger-서열 반응을 샘플 DNA에서 실행할 수 있다. 이와 같은 단일 패스 겔 서열화에서 얻어진 서열은 분지점 안팍을 읽는 Sfs와 비교하여, Sfs의 순서를 확인한다. 또한, 단일 패스 겔 서열화는 SBH와 복합하여 다시 핵산을 서열화한다.The sub-array method can effectively perform probe competition (overlapping probes) or probe cooperation (continuous probe stacking) in solving branching problems. After a hybrid reaction of a universal probe set, the sequence subsegments (SFs) that are recommended in the sequence merging program are determined. For further incorporation of SFs, EH from overlapping DNA fragment sequences, analogous sequences, single pass gel sequences should provide additional information from other hybrid reaction or restriction enzyme map data. Through a branch point, primers for a single pass gel sequence can be identified from SBH sequence information or other vector sequences known in the art, eg, sequences adjacent to the vector insertion site, standard Sanger-sequence reactions can be performed on the sample DNA. The sequence obtained in this single pass gel sequencing is compared to Sfs, which reads inside the branch point, to confirm the order of Sfs. In addition, single pass gel sequencing complexes with SBH to sequence the nucleic acid again.
경쟁적인 하이브리드 반응 및 지속적인 스태킹 상호작용을 이용하여 Sfs를 합체한다. 이와 같은 접근방식은 SBH에 의해 다수 샘플을 서열화하는데 제한된 가치를 가지지만, 이때 라벨된 프로브는 동일한 배열을 이용하는 경우에 배열에 고정된 샘플에 적용된다. 다행히, 레플리카 서브배열을 이용한 소수 샘플을 분석하면, 두 가지 방법을 효과적으로 실행할 수 있다. 동일한 서브배열에 스팟된 상이한 샘플에 있는 돌연변이된 서열을 푸는 것과 유사하게 프로브 풀(pool)을 이용하여 한 개 이상의 DNA 샘플에 대해 레플리카 서브배열 각각을 테스트하였다.Incorporate Sfs using competitive hybrid reactions and continuous stacking interactions. This approach has limited value for sequencing multiple samples by SBH, but labeled probes are applied to samples immobilized on the array when using the same array. Fortunately, analyzing a small number of samples using replica subarrays makes both methods more efficient. Each replica subarray was tested on one or more DNA samples using a probe pool similar to solving mutated sequences in different samples spotted in the same subarray.
이 실시예에서 설명한 64개 샘플 각각에서 약 100개 분저점이 있는 경우에, 각 서브배열에 나란하게 8개 샘플을 분석한 경우에, 적어도 800개 서브배열 프로브를 하면 모든 분지점을 해결할 수 있다. 이는 3072개 염기 프로브의 경우에 추가 800개 프로브(25%)를 이용한다는 것을 의미한다. 좀더 적절하게는, 한 개 분지점에 두 개 프로브를 이용한다는 것이다. 서브배열이 적은 경우에, 추가 프로브는 적게 이용된다. 예를 들면, 서브배열에 16개 샘플을 포함하는 경우에, 200개 추가 프로브가 기록된다(6%). 7-mer 프로브 (N1-2B7N1-2) 및 경쟁적인 또는 협조적인 분지 해결 방법을 이용하면, 약 1000bp 단편을 약 4000개 프로브로 합체할 수 있다. 또한, 8-mer 프로브 (NB8N)를 이용하는 경우에, 4 kb 또는 더 긴 단편을 12,000 프로브로 합체할 수 있다. 예를 들면, 분지점 수를 줄이기 위해서, 갭이 있는 프로브 즉, NB4NB3N 또는 NB4NB4N을 이용한다.In the case where there are about 100 split points in each of the 64 samples described in this embodiment, when 8 samples are analyzed in parallel in each subarray, at least 800 subarray probes can solve all the branch points. . This means that an additional 800 probes (25%) are used for the 3072 base probes. More suitably, two probes are used at one branch point. If the subarray is small, additional probes are used less. For example, if the subarray contains 16 samples, 200 additional probes are recorded (6%). Using a 7-mer probe (N 1-2 B 7 N 1-2 ) and a competitive or cooperative branching solution, about 1000 bp fragments can be incorporated into about 4000 probes. In addition, when using 8-mer probes (NB 8 N), 4 kb or longer fragments can be incorporated into 12,000 probes. For example, to reduce the number of branch points, use a probe with a gap, that is, NB 4 NB 3 N or NB 4 NB 4 N.
실시예 12 ; 서브배열 프로브에 일시적인 부착 및 라벨된 프로브의 결찰에 의한 DNA 분석Example 12; DNA analysis by transient attachment to subarray probes and ligation of labeled probes
4 내지 40개 정보길이를 가지는 올리고뉴클레오티드 염기는 표준 화학으로 합성하고, 튜브 또는 다중 웰 플레이트에 저장한다. 1 내지 10,000개 프로브로 구성된 특정 프로브 세트는 침전 또는 별도 서포트에서 합성 또는 큰 서포트의 별도 부분에서 합성하여 배열한다. 마지막 경우에, 물리적 또는 소수성 장벽을 이용하여 부분 또는 서브배열은 분리한다. 프로브 배열은 원위치에서 합성하여 만든다. 적절한 크기의 샘플 DNA는 한 개 이상의 특정 배열로 하이브리드한다. 많은 샘플이 동일한 배열에서 풀(pool)로 반응을 하거나 한 개 서포트내에 다른 서브배열과 독립적으로 반응을 한다. 샘플과 동시에 또는 연속하여, 한 개 라벨된 프로브 또는 라벨된 프로브 풀(pool)을 각 서브배열에 첨가한다. 부착된 라벨된 프로브는 이들이 결찰된 DNA내에 상보 표적에 back-bcak 하이브리드한다. 프로브로부터 라벨을 감지하여 결찰이 발생되는 것을 감지한다.Oligonucleotide bases having 4 to 40 information lengths are synthesized by standard chemistry and stored in tubes or multiple well plates. Specific probe sets consisting of from 1 to 10,000 probes are synthesized in precipitation or in separate supports or synthesized in separate parts of large supports. In the last case, partial or subarrays are separated using physical or hydrophobic barriers. Probe arrays are synthesized in situ. Appropriately sized sample DNA hybridizes into one or more specific arrays. Many samples react in pools in the same array or independently of other subarrays within one support. Simultaneously or sequentially with the sample, one labeled probe or labeled probe pool is added to each subarray. Attached labeled probes hybridize back-bcak to complementary targets within the DNA to which they are ligated. Detect labels from probes to detect ligation.
이 과정은 설명된 DNA 분석 과정의 변형으로 DNA 샘플이 서포트에 주로 부착되지 않는다. 서포트에 고정된 프로브를 이용하여 일시적으로 부착을 할 수 있다. 이 경우에, 표적 DNA 배열 과정이 필요없다. 또한, 짧은 고정된 프로브와 짧은 라벨된 프로브를 복합하여 더 긴 올리고뉴클레오티드 서열을 감지할 수 있다.This process is a variation of the described DNA analysis process, in which the DNA sample is not primarily attached to the support. It can be temporarily attached using a probe fixed to the support. In this case, no target DNA alignment process is necessary. Short immobilized probes and short labeled probes can also be combined to detect longer oligonucleotide sequences.
이 공정은 몇 가지 독특한 특징을 가진다. 기본적으로, 표적의 일시적인 부착으로 이를 다시 사용할 수 있다. 결찰이 발생된 후에, 표적은 방출되고, 라벨은 서포트에 공유결합된 상태로 유지된다. 이와 같은 특징으로 표적과 소량 표적에 대한 감지가능한 시그날 생산을 순환시킬 수 있다. 적절한 조건하에, 표적은 증폭시킬 필요가 없는데, 예를 들면, 천연 소스 DNA 샘플은 바로 진단 및 서열화 목적에 이용할 수 있다. 효과적인 하이브리드 반응 및 이중나선의 효과적인 용융사이에 온도를 순환시켜 표적을 방출시킨다. 좀더 적절하게는 순환을 시키지 않는다. 온도 및 성분의 농도는 자유 표적과 하이브리드에 들어간 표적의 비율이 약 50%:50% 수준의 평형을 이루도록 한다. 이와 같은 경우에. 결찰된 생성물을 지속적으로 생산할 수 있다. 목적이 다를 경우에, 다른 평형 비율을 적합하다.This process has some unique features. Basically, the temporary attachment of the target can be used again. After ligation occurs, the target is released and the label remains covalently attached to the support. This feature allows circulating detectable signal production for targets and small targets. Under appropriate conditions, the target does not need to be amplified, for example, a natural source DNA sample can be used directly for diagnostic and sequencing purposes. The target is released by cycling the temperature between the effective hybrid reaction and the effective melting of the double helix. More appropriately, do not cycle. The temperature and concentration of components causes the proportion of free and hybrid targets to equilibrate to about 50%: 50%. In such a case. Ligation products can be produced continuously. If the objectives are different, different equilibrium ratios are suitable.
전기장을 이용하여 표적 이용을 강화시킬 수 있다. 시작할 때, 각 서브배열내에 수평 펄스를 제공하면, 더 신속한 표적 분류를 할 수 있다. 이 상에서, 평형은 하이브리드 형성 쪽으로 이동되고, 라벨 안된 프로브를 이용할 수 있다. 표적 분류 상 다음에, 적절한 세척 단계(샘플의 움직임을 제한하기 위해 수직 전기장을 이용함)를 실시한다. 특이성을 증가시키기 위해, 식별성 하이브리드 용융, 하이브리드 반응, 결찰 및 사용 안된 표적의 제거 등으로 표적 수확 등의 몇 가지 과정을 도입할 수 있다. 그 다음 단계로, 라벨된 프로브를 첨가하고, 수직 전지 펄스를 제공한다. 온도를 증가시키면서, 자유 표적 및 하이브리드된 표적에 대한 최적의 비율을 얻는다. 수직 전기장은 분류된 표적의 확산을 방지한다.The electric field can be used to enhance target use. At the beginning, providing horizontal pulses within each subarray allows for faster target classification. In this phase, the equilibrium is shifted towards hybrid formation and an unlabeled probe can be used. Following the target classification, an appropriate washing step (using a vertical electric field to limit the movement of the sample) is performed. To increase specificity, several processes, such as harvesting targets, can be introduced, such as identifiable hybrid melting, hybrid reactions, ligation and removal of unused targets. In the next step, a labeled probe is added and a vertical cell pulse is provided. Increasing the temperature achieves an optimal ratio for the free and hybrid targets. Vertical electric fields prevent the spread of classified targets.
고정된 프로브와 라벨된 프로브 세트의 서브배열(특히, 보편적인 프로브 세트로부터 선택되거나 특별히 고안됨)을 다양한 방법으로 배열하여 효과적인 유연성 있는 서열화 및 진단 과정을 실시할 수 있다. 예를 들면, 짧은 단편의 박테리아 게놈(100-500 bp)을 부분적으로 또는 완전하게 서열화할 경우에, 공지 서열의 염기에 맞도록 고안된 소배열 프로브(길이가 5-30bp)를 이용할 수 있다. 서브배열당 10개 라벨된 상이한 프로브 풀과 반응하는 경우에, 200개 염기를 점검할 수 있는 각 10개 프로브를 가지는 10개 서브배열로 결찰에 의해 연결된 두 개 염기만을 기록하는 것으로 추정한다. 하이브리드를 통하여 미스메취(mismatch)를 식별할 수 있는 조건하에 프로브는 한 개 이상의 염기로 대체되어 동일한 수의 프로브를 가지는 더 긴 표적을 수용할 수 있다. 더 긴 프로브를 이용하여, 샘플에서 나머지 DNA로부터 분리하거나 증폭 없이, 표적을 바로 사용할 수 있다. 수득된 결과가 돌연변이 발생(또는 병인균)을 나타내는 경우에, 추가 프로브 풀(pool)을 이용하여 돌연변이 또는 병인균 서브타입을 감지할 수 있다. 환자의 일부분이 감염 또는 돌연변이된 것일 경우에 예방 진단에서 이 공정은 비용 측면에서 매우 효과적이다.Subarrays of immobilized and labeled probe sets (particularly selected or specially designed from universal probe sets) can be arranged in a variety of ways to effect effective flexible sequencing and diagnostic procedures. For example, when partially or completely sequencing a short fragment of the bacterial genome (100-500 bp), small array probes (5-30 bp in length) designed to fit the base of a known sequence can be used. When reacting with a pool of 10 labeled different probes per subarray, it is estimated to record only two bases linked by ligation into 10 subarrays with 10 probes each capable of checking 200 bases. Under conditions capable of identifying mismatches through hybridization, probes may be replaced with one or more bases to accommodate longer targets with the same number of probes. Longer probes can be used to target directly, without amplification or separation from the rest of the DNA in the sample. If the results obtained indicate mutagenesis (or pathogen), additional pools of probes can be used to detect mutations or pathogen subtypes. This process is very cost effective in prophylactic diagnosis where part of the patient is infected or mutated.
실시예에서 설명하는 공정에서, 다양한 감지 방법이 이용될 수 있는데, 예를 들면, 방사능라벨, 형광 라벨, 효고, 항체(화학적발광), 빛 분산 또는 간섭계 과정에 의해 감지할 수 있는 큰 분자 또는 입자를 이용할 수 있다.In the process described in the examples, various sensing methods can be used, for example, large molecules or particles that can be detected by radiolabels, fluorescent labels, Hyogo, antibodies (chemical luminescence), light dispersion or interferometric processes. Can be used.
실시예 13 ; 옥타머 및 나노머를 이용한 표적의 서열화Example 13; Sequencing Targets with Octamers and Nanomers
옥타머 및 나노머 올리고뉴클레오티드의 하이브리드 반응 데이터로부터 하이브리드에 의한 서열화는 상당한 정도의 정확성을 제공한다는 것을 보여준다. 이 실험에서, 공지의 서열을 이용하여 옥타머 및 나노머 올리고뉴클레오티드와 겹쳐지는 것을 예측할 수 있다.Sequencing by hybrid from hybrid reaction data of octamer and nanomeric oligonucleotides shows that it provides a significant degree of accuracy. In this experiment, known sequences can be used to predict overlap with octamer and nanomeric oligonucleotides.
완전하게 짝을 이루는 올리고뉴클레오티드에 추가하여, 올리고뉴클레오티드에 의해 형성된 이중나선에서 내부 또는 단부 미스메취(mismatch)가 있는 미스메취(mismatch) 올리노뉴클레오티드, 표적을 검사한다. 이와 같은 분석 시에, 최저 실험 온도를 이용하여 하이브리드 반응 형성을 최대화할 수 있다. 동일한 또는 더 낮은 온도에서 세척을 실행하여, 미스메취(mismatch)된 올리고뉴클레오티드/표적 하이브리드 반응 및 메취된 올리고뉴클레오티드/표적 하이브리드 반응의 더 큰 해리 속도를 이용하여, 식별을 최대화한다. 하이브리드의 절대적인 수득율은 서열에 따라 달라지기는 하지만, 이와 같은 조건은 모든 서열에 적용할 수 있다.In addition to fully paired oligonucleotides, targets are examined for mismatch olinonucleotides with internal or end mismatches in the double helix formed by the oligonucleotides. In such an analysis, the lowest experimental temperature can be used to maximize hybrid reaction formation. Washes are performed at the same or lower temperatures to maximize identification using the larger dissociation rates of mismatched oligonucleotide / target hybrid reactions and matched oligonucleotide / target hybrid reactions. While the absolute yield of hybrids depends on the sequence, such conditions can apply to all sequences.
적어도 미스메취(mismatch)를 불안정하게 하는 것은 간단한 단부 미스메취(mismatch)로, 하이브리드 반응에 의한 서열화 테스트는 단부-미스메취(mismatch)된 올리고뉴클레오티드/표적 이중나선으로부터 완전하게 메취되는 올리고뉴클레오티드/표적 이중나선을 식별해내는 능력이다.Destabilizing at least mismatches is a simple end mismatch, where sequencing tests by hybrid reactions are oligonucleotides / targets that are completely matched from end-mismatched oligonucleotides / target duplexes. The ability to identify double helices.
도트 블랏 포맷에 있는 105개 하이브리드된 올리고뉴클레오티드중 102개의 식별값은 2이상으로 매우 정확한 서열 발생을 허용한다. 이와 같은 시스템은 또한, 하이브리드 반응 형성 및 하이브리드 반응 불안정에 대해 서열의 영향을 평가할 수 있다.102 identifications out of 105 hybridized oligonucleotides in dot blot format allow for highly accurate sequence generation of two or more. Such a system can also assess the impact of sequences on hybrid reaction formation and hybrid reaction instability.
PCR에 의해 준비된 사람-인터페론 유전자의 공지 부분의 100개 염기쌍, 가령, 100bp 표적 서열은 표적 핵산에 대해 공지의 서열을 가지는 105개 올리고뉴클레오티드 프로브를 하이브리드시켜 얻은 데이터로부터 얻는다. 이용된 올리고뉴클레오티드 프로브는 72개 옥타머 및 21개 나노머 올리고뉴클레오티드로 이 서열은 표적에 대해 완전하게 상보적이다. 93개 프로브 세트는 한 개 또는 두 개 염기가 치환된 표적 서열을 연속하여 겹쳐지는 프레임을 제공한다.100 base pairs, such as 100 bp target sequences, of the known portion of the human-interferon gene prepared by PCR are obtained from data obtained by hybridizing 105 oligonucleotide probes having a known sequence to the target nucleic acid. The oligonucleotide probes used were 72 octamers and 21 nanomeric oligonucleotides, which sequence is completely complementary to the target. The 93 probe sets provide a frame that continuously overlaps the target sequence with one or two bases substituted.
미스메취(mismatch)의 영향을 평가하기 위해, 100bp 테스트 표적 서열에 하이브리드되는 경우에, 적어도 한 개 말단 미스메취(mismatch)를 포함하는 12개 추가 프로브에 대해 하이브리드 반응을 검사하였다. 표적과 함께 12개 프로브의 하이브리드 반응이 선택된 4개 다른 기준 핵산에 대해 말단-미스메취(mismatch)되는 지를 테스트하여, 형성된 12개 올리고뉴클레오티드가 4개 기준 DNA와 이중 하이브리드와 완전하게 매취된다. 따라서, 내부에 미스메취(mismatch)된 올리고뉴클레오티드와 표적 이중나선쌍, 말단-미스메취(mismatch)된 올리고뉴클레오티드와 표적 이중나선쌍, 완전히 메취된 올리고뉴클레오티드와 표적 이중나선쌍의 하이브리드 반응을 실험에 이용된 각 올리고뉴클레오티드에 대해 평가하였다. 테스트 옥타머 및 나노머 올리고뉴클레오티드와 하이브리드 반응을 하는 경우에 절대적인 DNA 표적 농도의 효과는 상이한 올리고뉴클레오티드 프로브가 공동 증폭된 플라스미드 DNA내에 한 개의 비-표적 부위에 대한 하이브리드 반응을 감지하여 표적 DNA 농도를 정의함으로써 결정한다.To assess the impact of mismatches, hybrid responses were examined for 12 additional probes containing at least one terminal mismatch when hybridized to 100 bp test target sequences. By testing whether the hybrid reaction of 12 probes with the target is end-mismatched against 4 selected reference nucleic acids, the 12 oligonucleotides formed are completely matched with the 4 reference DNAs and the double hybrid. Therefore, hybrid reactions of mismatched oligonucleotides with target double helix pairs, end-mismatched oligonucleotides with target double helix pairs, and fully matched oligonucleotides with target double helix pairs were tested. Each oligonucleotide used was evaluated. The effect of absolute DNA target concentrations in hybrid reactions with test octamer and nanomeric oligonucleotides is that different oligonucleotide probes detect hybrid responses to one non-target site in co-amplified plasmid DNA to target DNA concentrations. Determine by definition.
이 실험 결과로부터 표적 또는 기준 DNA에 대해 완전하게 메취되는 상보 서열을 포함하는 모든 올리고뉴클레오티드는 미스메취(mismatch)를 가지는 올리고뉴클레오티드보다는 더 강하게 하이브리드한다는 것을 보여준다. 이 결론에 도달하기 위해, 각 프로브에 대한 Hp및 D 값을 검사하였다. Hp는 제 1 표적 및 올리고뉴클레오티드 프로브사이에 형성된 하이브리드 이중나선의 양을 나타낸다. 105개 프로브에 대해 수득한 하이브리드 반응에 0 내지 10의 값을 할당하면, 105개 프로브의 68.5%는 2이상의 Hp값을 가지는 것으로 나타났다.The results of this experiment show that all oligonucleotides that contain complementary sequences completely matched to the target or reference DNA hybridize more strongly than oligonucleotides with mismatches. To reach this conclusion, the H p and D values for each probe were examined. H p represents the amount of hybrid double helix formed between the first target and the oligonucleotide probe. Assigning a value of 0 to 10 to the hybrid reactions obtained for 105 probes, 68.5% of the 105 probes were found to have Hp values of 2 or more.
식별(D)는 (1) 테스트 올리고뉴클레오티드와 표적 또는 기준 핵산 사이에 형성된 완전하게 메취된 이중나선을 포함하는 도트와 2) 표적 또는 기준 핵산내에 상이한 부위 및 동일한 올리고뉴클레오티드사이에 형성된 미스메취(mismatch) 이중나선을 포함하는 도트사이에 시그날 강도 비율을 나타내는 것으로 이 값을 얻을 수 있다. D 값의 변화는 1) 배경이상의 시그날을 보기 위해 하이브리드 효과에 변동을 주거나; 2) 테스트 올리고뉴클레오티드와 표적사이에 발견되는 미스메취(mismatch) 타입으로 인한 것이다. 이 실험에서 수득된 D 값은 검사한 105개 올리고뉴클레오티드 프로브중 102개는 2 내지 40이다. 102개 올리고뉴클레오티드의 D 값을 대체로 계산하면, 평균 D는 10.6이다.Identification (D) includes (1) a dot comprising a fully mesoformed double helix formed between a test oligonucleotide and a target or reference nucleic acid, and 2) a mismatch formed between different sites and the same oligonucleotide within the target or reference nucleic acid. This value can be obtained by indicating the signal intensity ratio between dots including a double helix. Changes in the D value can either: 1) change the hybrid effect to see a signal above background; 2) due to mismatch types found between the test oligonucleotide and the target. The D value obtained in this experiment is 102 to 102 of the 105 oligonucleotide probes tested. Computing the D value of 102 oligonucleotides generally, the average D is 10.6.
말단-미스메취(mismatch)를 나타내는 올리고뉴클레오티드/표적 이중나선은 20가지가 있다. 이들중 5경우는 D가 10이상이었다. 이 경우에 D 값이 큰 경우는 대부분 안정한 (G/T 및 G/A) 말단 미스메취(mismatch)이외의 다른 원인에 의한 하이브리드 반응 불안정으로 인한 것이 대부분이다. 다른 가능성은 올리고뉴클레오티드 또는 표적 서열에 오류가 있는 것이다.There are 20 oligonucleotide / target double helices that exhibit end-mismatches. In five of these cases, D was 10 or more. In this case, large D values are mostly due to hybrid reaction instability due to causes other than stable (G / T and G / A) terminal mismatches. Another possibility is an error in the oligonucleotide or target sequence.
Hp값이 낮은 프로브의 경우에 표적에 있는 오류는 배제하는데 그 이유는 이와 같은 오류는 다른 8개 겹쳐지는 올리고뉴클레오티드 각각의 하이브리드 반응에 영향을 주기 때문이다. 다른 겹쳐지는 올리고뉴클레오티드에 대한 서열 미스메취(mismatch)로 인하여 실제 불안정성은 없는데, 이는 표적 서열이 정확하다는 것을 말한다. 7개 새로 합성된 올리고뉴클레오티드의 하이브리드 반응을 재검사한 후에 올리고뉴클레오티드에 오류는 배제된다. 7개중 1개의 올리노뉴클레오티드만이 D 값이 더 우수하였다. 낮은 하이브리드 형성 값은 하이브리드 불안정 또는 하이브리드 이중나선을 형성하는 능력이 없기 때문이다. 하이브리드 이중나선을 형성하는 능력이 없는 것은 1) 선택된 프로브의 자체 상보성 또는 2)표적/표적 자체 하이브리드 반응때문이다. 유사하게, 표적이 자체-상보적이거나 내부에 필린드롬(palindrom)을 형성하는 경우에 표적/표적 연합이 잘된다. 이와 같은 가능성을 평가할 때, 문제가 되는 프로브는 이들자체와 하이브리드되지 않는다는 프로브 분석이 나타났다. 또한, 표적/표적 하이브리드 반응 분포를 검사하면, 문제가 되는 올리고뉴클레오티드 프로브중 하나는 동일한 표적을 포함하는 두 개 상이한 DNA와 비효과적으로 하이브리드되는 것을 알 수 있다. 두 개 상이한 DNA가 동일 표적 서열에 대해 자체-상보적인 부분을 가질 가능성이 낮은 경우에, 표적/표적 하이브리드 반응은 낮은 하이브리드 반응 형성에 기여하지 않는다는 것이다. 따라서, 이와 같은 결론은 하이브리드의 불안정 및 하이브리드를 형성하지 않는 능력이 특정 올리고뉴클레오티드에서 관찰되는 낮은 하이브리드 형성의 원인이라는 것을 나타낸다. 또한, 결과에 따르면, 하이브리드 형성이 낮은 것은 특정 올리고뉴클레오티드의 특정 서열 때문이다. 또한, 그 결과로, 옥타머 및 나노머 올리고뉴클레오티드를 이용하면, 서열을 만드는데 있어서 신뢰성 있는 결과를 얻을 수 있다는 것이다.In the case of probes with low H p values, errors in the target are excluded because such errors affect the hybrid reaction of each of the other eight overlapping oligonucleotides. There is no real instability due to sequence mismatches to other overlapping oligonucleotides, indicating that the target sequence is correct. After retesting the hybrid reaction of the seven newly synthesized oligonucleotides, the errors in the oligonucleotides are excluded. Only 1 of 7 olinonucleotides had a better D value. Low hybrid formation values are due to the lack of hybrid instability or the ability to form a hybrid double helix. The inability to form a hybrid double helix is due to 1) the self complementarity of the selected probe or 2) the target / target self hybrid reaction. Similarly, target / target association works well when the target is self-complementary or forms a palindrom therein. In assessing this possibility, probe analysis showed that the probes in question were not hybridized with themselves. In addition, examination of the target / target hybrid response distribution reveals that one of the oligonucleotide probes in question is ineffectively hybridized with two different DNA containing the same target. If two different DNAs are unlikely to have self-complementary portions to the same target sequence, then the target / target hybrid reaction does not contribute to the formation of a low hybrid reaction. Thus, this conclusion indicates that the instability of the hybrid and the ability to not form a hybrid is responsible for the low hybrid formation observed in certain oligonucleotides. In addition, the results show that the low hybrid formation is due to specific sequences of specific oligonucleotides. As a result, octamer and nanomeric oligonucleotides can be used to obtain reliable results in the construction of sequences.
이와 같은 결과는 여기에서 설명하는 방법을 이용하면, 구성 올리고뉴클레오티드를 최대로 독특하게 겹치면, 임의 특이적인 표적 핵산의 긴 서열을 만들 수 있다는 것을 보여준다. 이와 같은 서열화 방법은 올리고머의 개별 성분에 따른 것이고, 이들의 빈도 및 위치와는 무관하다는 것을 나타낸다.These results show that using the methods described herein, maximally unique overlaps of constituent oligonucleotides can produce long sequences of arbitrary specific target nucleic acids. Such sequencing methods are dependent on the individual components of the oligomer and indicate that they are independent of their frequency and location.
하기에서 설명하는 알고리즘을 이용하여 만든 서열은 충실도가 높다. 알고리즘은 하이브리드 반응 도트에서 발생되는 가짜 양성 시그날을 묵과하는데, 이는 4개의 다소 신뢰성이 적은 값을 포함하는 105개 하이브리드 반응 값에서 나온 서열이 정확하다는 것으로 알 수 있다. 하이브리드 반응에 의해 서열화하는데 이와 같은 충실도는 짧은 올리고뉴클레오티드 하이브리드 반응의 "전부(all) 또는 전무(none)" 운동학 및 완전하게 메취된 이중나선 및 미스메취(mismatch)된 이중나선사이에 존재하는 이중 나선의 안정성 차이 때문이다. 매취된 이중나선과 말단-미스메취(mismatch) 이중나선의 이중나선 안정성 비율은 이중나선의 길이가 감소함에 따라 증가된다. 또한, 이중 나선의 길이가 감소되면 결합 에너지가 감소되어, 하이브리드 반응 효과가 낮아진다. 그러나, 제공된 결과에 따르면, 옥타머 하이브리드 반응으로 이중나선의 안정성 및 식별에 영향을 끼치는 인자가 균형을 이루어 하이브리드 반응에 의해 매우 정확한 서열화 벙법을 제공한다. 다른 실시예에서 제시된 결과에서는 6,7,8개 뉴클레오티드를 가지는 올리고뉴클레오티드를 효과적으로 이용하여, 0.5kb(hexamer의 경우), 2kb(septamer의 경우), 6kb(octamer의 경우)의 표적에서 신뢰성 있는 서열을 만든다. 긴 단편 서열이 겹쳐져 완전한 게놈 서열을 만든다.Sequences created using the algorithm described below have high fidelity. The algorithm ignores the false positive signal generated at the hybrid response dot, indicating that the sequence from the 105 hybrid response values, including four somewhat less reliable values, is accurate. This fidelity, which is sequenced by hybrid reactions, is characterized by the “all or none” kinetics of the short oligonucleotide hybrid reactions and the double helix that exists between the fully mesmerized double helix and the mismatched double helix. Because of the stability difference. The double helix stability ratio of the acquired double helix and the end-mismatch double helix increases as the length of the double helix decreases. In addition, reducing the length of the double helix reduces the binding energy, which lowers the hybrid reaction effect. However, according to the results provided, the octamer hybrid reaction balances factors affecting the stability and identification of the double helix, providing a highly accurate sequencing method by the hybrid reaction. In the results presented in another example, oligonucleotides with 6, 7, 8 nucleotides can be used effectively to achieve reliable sequences at targets of 0.5 kb (hexamer), 2 kb (septamer) and 6 kb (octamer) Make Long fragment sequences overlap to form a complete genomic sequence.
실시예 14 ; 수득된 데이터 분석Example 14; Analysis of the data obtained
DOTS 프로그램(Drmanac et al., 1993)과 같은 상 분석 프로그램을 이용하여 이미지 파일을 분석하고, SCORES 프로그램(Drmanac et al. 1994)과 같은 통계함수를 이용하여 평가한다. 시그날 분포로부터, 스그날을 +/-로 변환시키는데 최적의 발단을 결정한다. 공지의 고정된 프로브와 라벨된 위치에 상응하는 라벨된 프로브의 서열을 복합하여, 단편으로부터 F + P 뉴클레오티드 서열을 결정할 수 있다. 컴퓨터에 의해 결정된 겹쳐지는 F + P로부터, 사람 염색체와 같은 고유 분자의 완전한 핵산 서열 또는 부단편의 서열을 합체할 수 있다.Image files are analyzed using a phase analysis program such as the DOTS program (Drmanac et al., 1993) and evaluated using statistical functions such as the SCORES program (Drmanac et al. 1994). From the signal distribution, the optimal initiation to convert the signal to +/- is determined. The sequences of labeled probes corresponding to the labeled positions with known fixed probes can be combined to determine F + P nucleotide sequences from fragments. From the overlapping F + Ps determined by the computer, the complete nucleic acid sequence or subfraction sequence of the native molecule, such as a human chromosome, can be coalesced.
한 가지 선택은 서열 합체 과정동안에 하이브리드 반응 시그날(숫자)을 +/-로 변환시키는 것이다. 이 경우에서, F + P 서열이 AAAAAATTTTTT인 매우 수가 큰 F + P로 합체를 시작한다. 네 가지 가능한 겹쳐지는 프로브 AAAAATTTTTTA, AAAAATTTTTT, AAAAATTTTTTC, AAAAATTTTTTG와 시작이 다른 세 개 추가 프로브(TAAAAATTTTTT, CAAAAATTTTTT, GAAAAATTTTTT)를 비교하고, 세 가지 결과를 확인한다; (i) 시작 프로브와 네 개 겹쳐지는 프로브중 한 개만이 다른 6개 프로브에 비해 상대적으로 양성인 기록을 가지고, AAAAAATTTTTT의 경우에, 오른쪽으로 한 개 뉴클레오티드가 연장된다; (ii) 시작 프로브만을 제외하고는 상당한 양성 기록을 가지는 프로브는 없고, 합체를 중단하는데, 예를 들면 AAAAAATTTTT 서열은 서열화되는 DNA 분자의 말단이 되고; (iii) 겹쳐지는 또는 다른 세 개 프로브가운데 한 개 상당한 양성 프로브 이상이 발견되고; 오류 또는 분지 때문에 합체가 중단된다(Drmanac et al., 1989).One option is to convert the hybrid reaction signal (number) to +/- during the sequence merging process. In this case, coalescing starts with a very large number of F + Ps where the F + P sequence is AAAAAATTTTTT. Compare the four possible overlapping probes AAAAATTTTTTA, AAAAATTTTTT, AAAAATTTTTTC, AAAAATTTTTTG and three additional probes with different start (TAAAAATTTTTT, CAAAAATTTTTT, GAAAAATTTTTT) and confirm three results; (i) only one of the four overlapping probes with the starting probe has a relatively positive record compared to the other six probes, and in the case of AAAAAATTTTTT, one nucleotide is extended to the right; (ii) no probes with significant positive records except start probes, and stop coalescence, eg, the AAAAAATTTTT sequence becomes the end of the DNA molecule being sequenced; (iii) one or more significant positive probe abnormalities are found among the overlapping or three other probes; The coalescence is stopped because of errors or branching (Drmanac et al., 1989).
컴퓨터를 이용한 유추 공정은 기존의 알고리즘을 이용하는 컴퓨터 프로그램을 이용한다(Pevzner, 1989; Drmanac et al., 1991; Labat and Drmanac, 1993).Computer-based analogy processes use computer programs that use existing algorithms (Pevzner, 1989; Drmanac et al., 1991; Labat and Drmanac, 1993).
F + P에 추가하여, F(space 1)P, F(space 2)P, F(space 3)P, F(space 4)가 결정되면, 알고리즘을 이용하여 모든 데이터를 메취시켜, 가능한 오류를 정정하거나 분지점 문제가 있는 상황을 해결한다((Drmanac et al., 1989; Bains et al., 1988;).In addition to F + P, if F (space 1) P, F (space 2) P, F (space 3) P, and F (space 4) are determined, an algorithm is used to map all the data to find possible errors. Resolve situations that are corrected or have branching problems (Drmanac et al., 1989; Bains et al., 1988;).
실시예 15: 2단계 교합에 의한 서열화 방법Example 15: Sequencing method by two-stage occlusion
다음 실시예들은 본 발명자에 의해 고려된 서열화 방법을 보여준다. 먼저, 전체 칩이 1억 bp(하나의 인간 염색체) 정도의 복잡한 DNA 혼합물과 교잡된다. 교잡을 수행하기 위한 가이드라인은 Drmanac(1990); Khrapko(1991); Broude(1994)와 같은 논문에서 발견된다. 이들 문헌은 포맷 3 SBH의 초기 단계에서 사용하기 적절한 세척단계, 버퍼 및 교잡온도 범위가 제시한다.The following examples show sequencing methods contemplated by the inventors. First, the entire chip is hybridized with a complex DNA mixture of about 100 million bp (one human chromosome). Guidelines for performing hybridization include Drmanac (1990); Khrapko (1991); Found in a paper such as Broude (1994). These documents suggest wash steps, buffers and hybridization temperature ranges suitable for use in the early stages of Format 3 SBH.
본 발명자는 특히 제공될 수 있는 타겟 DNA의 매우 낮은 농도 때문에 교잡이 저온(-2 내지 5℃), 고농도 염에서 최대 수시간동안 수행되어야 한다고 판단하였다. 이러한 목적을 위해서 10℃에서 침전하는 인산나트륨 버퍼(Drmanac, 1990) 대신에 SSC 버퍼가 사용된다. 세척은 제 2 단계 때문에 과도할 필요는 없고 (수분) 대단히 복잡한 DNA 샘플 서열화에 교잡싸이클링이 사용될 때 완전 제거될 수 있다. 동일한 버퍼가 라벨링된 프로브를 사용한 제 2 교잡단계를 계속할 수 있도록 교잡 및 세척 단계동안 사용된다.The inventors have determined that the hybridization should be performed for up to several hours at low temperatures (-2-5 ° C.), high concentration salts, due to the very low concentration of target DNA that can be provided. For this purpose SSC buffers are used instead of sodium phosphate buffer (Drmanac, 1990) which precipitates at 10 ° C. The wash does not need to be excessive due to the second step and can be completely eliminated when hybridization is used for (moisture) highly complex DNA sample sequencing. The same buffer is used during the hybridization and wash steps to continue the second hybridization step with the labeled probe.
각 배열(8 ×8㎜)상의 간단한 로보트 장치를 사용한 적절한 세척후 하나의 라벨링된 프로브(6-머)가 첨가된다. 96-팁 또는 96-핀 장치가 사용되어 42 공정으로 이를 수행한다. 공지 과학문헌에 기술된 범위의 판별 조건이 사용될 수 있다.One labeled probe (6-mer) is added after appropriate washing using a simple robotic device on each array (8 × 8 mm). A 96-tip or 96-pin device is used to accomplish this in 42 processes. Determination conditions in the range described in the known scientific literature can be used.
본 발명자는 특히 다음 조건을 사용한다. 첫째, 라벨링된 프로브를 첨가하고 저온(0-5℃)에서 단지 수분간(첨가된 올리고누클레오티드가 고농도이므로) 배양한 후 F + P 길이에 따라 온도가 3-10℃로 증가되고 세척 버퍼가 첨가된다. 이 순간에 사용된 세척버퍼는 리게이션 반응과 상용성인 것이다(즉, 100mM 염농도). 리가아제 첨가후 온도가 다시 15-37℃로 상승되어서 신속한 리게이션(30분 미만)과 완전 일치 및 불일치 하이브리드의 판별을 허용한다.The present inventors use the following conditions especially. First, the labeled probe is added and incubated at low temperature (0-5 ° C.) for only a few minutes (since the added oligonucleotide is high concentration), then the temperature is increased to 3-10 ° C. depending on F + P length and washing buffer is added do. The wash buffer used at this moment is compatible with the ligation reaction (ie 100 mM salt concentration). After ligase addition the temperature is raised back to 15-37 ° C. to allow rapid ligation (less than 30 minutes) and discrimination of complete and inconsistent hybrids.
Pontius & Berg(1991)에 의해 발표된대로 포맷 3 SBH에서 양이온 세제의 사용이 또한 고려된다. 이들은 DNA 재변성에 두 가지 단순한 양이온 세제인 도데실- 및 세틸- 트리메틸브롬화 암모늄(DTAB 및 CTAB)을 사용한다.The use of cationic detergents in format 3 SBH is also contemplated as published by Pontius & Berg (1991). They use two simple cationic detergents, dodecyl- and cetyl-trimethyl ammonium bromide (DTAB and CTAB), for DNA regeneration.
DTAB 및 CTAB는 메틸기가 12-탄소 알킬기로 대체된 (DTAB) 또는 16-탄소 알킬기로 대체된 (CTAB) 4차 아민 테트라메틸브롬화암모늄(TMAB)의 변성 화합물이다. TMAB는 테트라메틸암모늄 이온의 브롬염으로서 G-C 함량에 의한 용융온도를 감소시키기 위해서 핵산 재변성 실험에 사용된 시약이다. DTAB 및 CTAB는 SDS의 음전하를 띤 술페이트가 양전하를 띤 4차 아민으로 대체되면 나트륨 도데실 술페이트(SDS)와 구조가 유사하다. SDS는 교잡 버퍼에서 비특이성 결합을 감소시키고 누클레아제를 억제하기 위해서 보통 사용되지만 재변성 속도에 큰 영향을 주지는 못한다.DTAB and CTAB are modified compounds of (DTAB) quaternary amine tetramethylammonium bromide (TMAB) with methyl groups substituted with 12-carbon alkyl groups or (CTAB) with 16-carbon alkyl groups. TMAB is a bromine salt of tetramethylammonium ions and is a reagent used in nucleic acid regeneration experiments to reduce the melting temperature due to G-C content. DTAB and CTAB are similar in structure to sodium dodecyl sulfate (SDS) when the negatively charged sulfate of SDS is replaced by a positively charged quaternary amine. SDS is commonly used to reduce nonspecific binding and inhibit nucleases in hybridization buffers but does not significantly affect the rate of regeneration.
리게이션 공정을 사용할 때 라벨링된 프로브와 함께 또는 배경을 감소시키는 적절한 세척단계 후에 효소가 첨가될 수 있다. 모든 SBH 방법에서 사용되지는 않을지라도 리가아제 기술은 분자생물학 분야에 잘 확립되어 있다. 예컨대 Hood등은 포맷 3 SBH에 쉽게 사용될 수 있는 리가아제-중재 유전자 탐지기술(Landegren, 1988)을 발표한다. Wu와 Wallace 역시 두 개의 인접한 짧은 올리고누클레오티드를 연결하기 위해서 박테리오파아지 T4 DNA 리가아제를 사용한다. 이들의 올리고 리게이션 반응은 50mM 트리스 HCl, pH 7.6, 10mM MgCl2, 1mM ATP, 1mM DTT 및 5% PEG에서 수행된다. 리게이션 반응은 5-10분간 100℃까지 가열되고 T4 DNA 리가아제(1단위; Bethesda 연구실)의 첨가에 앞서 0℃까지 냉각하는 과정을 포함한다. 대개의 리게이션 반응은 30℃에서 수행되고 5분간 100℃로 가열함으로써 종결된다.Enzymes can be added with labeled probes or after appropriate washing steps to reduce background when using the ligation process. Although not used in all SBH methods, ligase technology is well established in the field of molecular biology. For example, Hood et al. Present a ligase-mediated gene detection technique (Landegren, 1988) that can be readily used in format 3 SBH. Wu and Wallace also use bacteriophage T4 DNA ligase to link two adjacent short oligonucleotides. Their oligo ligation reaction is carried out in 50 mM Tris HCl, pH 7.6, 10 mM MgCl 2 , 1 mM ATP, 1 mM DTT and 5% PEG. The ligation reaction involves heating to 100 ° C. for 5-10 minutes and cooling to 0 ° C. prior to the addition of T4 DNA ligase (1 unit; Bethesda Laboratories). Most ligation reactions are carried out at 30 ° C. and terminated by heating to 100 ° C. for 5 minutes.
길이(F + P)의 교잡된 인접 또는 리게이션 반응된 올리고누클레오티드의 판별탐지에 적절한 최종 세척이 이후에 수행된다. 이러한 세척단계는 수분간 40-60℃의 물에서 수행되어서 리게이션 반응안된 모든 라벨링된 프로브 및 기타 화합물을 씻어내어 배경을 최대로 감소시킨다. 공유 결합된 라벨링된 올리고누클레오티드 때문에 탐지는 단순화된다(시간이 걸리지 않으며 저온 제한이 필요없다).A final wash suitable for the detection of hybridized contiguous or ligation reacted oligonucleotides of length (F + P) is then performed. This washing step is carried out in water at 40-60 ° C. for several minutes to rinse off all labeled probes and other compounds that are not ligated to maximize background. Detection is simplified because of covalently labeled labeled oligonucleotides (it does not take time and no low temperature limit is required).
사용된 라벨에 따라서 다양한 장치를 사용한 칩 영상화가 가능하다. 방사능 라벨의 경우에 스캐너로서 인영상기와 인저장 스크린 기술이 사용될 수 있다(Molecular Dynamics, Sunnyvale, CA). 칩을 카세트에 담고 인 스크린으로 덮는다. 1-4시간 노출후 스크린을 스캐닝하고 컴퓨터 하드디스크에 영상파일이 저장된다. 형광라벨의 탐지할 경우 CCD 카메라와 에피-형광 또는 공촛점 현미경이 사용된다. CCD 카메라의 픽셀상에 직접 발생된 칩의 경우에 Eggers(1994)에 의해 발표된 탐지방법이 수행된다.Depending on the label used, chip imaging with various devices is possible. In the case of radioactive labels, an imager and in-store screen technology can be used as scanners (Molecular Dynamics, Sunnyvale, CA). Place the chips in a cassette and cover with an in-screen. After 1-4 hours of exposure, the screen is scanned and the image file is saved on your computer's hard disk. For the detection of fluorescent labels, CCD cameras and epi-fluorescence or confocal microscopes are used. In the case of a chip generated directly on the pixel of the CCD camera, the detection method published by Eggers (1994) is performed.
전하쌍 장치(CCD) 탐지기는 프로브 기초 분석에서 라벨링된 타겟 분자의 분포를 영상화하고 정량적으로 탐지하는 활성 고체 담체로서 작용하다. 이 장치는 대단히 유사한 분석, 자외선에 민감한 탐지, 고처리량, 집적된 데이터 인식 및 계산을 가능하게 하는 미소전자장치의 고유한 특성을 이용한다. Egger(1994)는 본 발명의 포맷 3 SBH와 같은 프로브 기초 분석에 사용하는 CCD를 발표하는데, 이것은 고민감도 및 직접 커플링으로 인해 수초내에 정량평가를 가능하게 한다.Charge pair device (CCD) detectors serve as active solid carriers that image and quantitatively detect the distribution of labeled target molecules in probe based assays. The device takes advantage of the unique characteristics of microelectronics that allow for very similar analysis, UV-sensitive detection, high throughput, integrated data recognition and computation. Egger (1994) discloses a CCD for use in probe based analysis, such as the Format 3 SBH of the present invention, which allows for quantitative evaluation in seconds due to sensitivity and direct coupling.
집적된 CCD 탐지방법은 칩상의 분자 결합 사전의 탐지를 가능하게 한다. 이 탐지기는 샘플을 고유 분석하게 하는 2차원 패턴을 빠르게 발생한다. CCD 기초 분자 탐지기의 작동에서 상이한 생물학적 프로브가 CCD의 픽셀상에 직접 부동화되거나 CCD 표면상에 위치된 일회용 커버 슬립에 부착될 수 있다. 샘플분자는 방사능 동위원소, 형광성 또는 화학발광성 태그로 라벨링될 수 있다.Integrated CCD detection methods enable the detection of molecular binding dictionaries on a chip. The detector quickly generates a two-dimensional pattern that allows samples to be uniquely analyzed. In the operation of the CCD elementary molecular detector, different biological probes may be immobilized directly on the pixels of the CCD or attached to a disposable cover slip located on the CCD surface. Sample molecules may be labeled with radioactive isotopes, fluorescent or chemiluminescent tags.
CCD 기초 프로브 배열에 샘플을 노출하면 포맷 3의 경우에 샘플이 두 개의 상보적 프로브에 결합된 픽셀 지점에서 광자 또는 방사능동위원소 붕괴 생성물이 방출된다. 혹은 전하를 띤 입자나 라벨링된 샘플에서 나오는 복사에너지가 CCD 게이트상에 입사할 때 전자-정공쌍이 실리콘에서 발생된다. 이후에 인접한 CCD 게이트 아래에서 전자가 수집되고 디스플레이 모듈상에서 순차적으로 판독된다. 각 픽셀에서 발생된 광전자의 갯수는 이러한 지점에서 분자적 결합 사건의 수에 정비례한다. 결과적으로 분자 결합이 정량적으로 결정될 수 있다(Eggers, 1994).Exposure of the sample to the CCD based probe array results in photon or radioisotope decay products at the pixel point where the sample is bound to two complementary probes in the case of format 3. Alternatively, electron-hole pairs are generated in silicon when radiated energy from charged particles or labeled samples enters the CCD gate. The electrons are then collected under the adjacent CCD gate and read sequentially on the display module. The number of photons generated at each pixel is directly proportional to the number of molecular binding events at this point. As a result, molecular binding can be determined quantitatively (Eggers, 1994).
샘플에 인접하게 영상화 배열을 위치시킴으로써 종래적인 CCD 카메라에서 발견되는 렌즈 기초 기술에 비해 수집 효율이 10배 이상 향상된다. 즉, 샘플(이미터)이 탐지기(영상화 배열)와 접촉시켜 렌즈 및 거울과 같은 종래적인 영상화 광학 기소를 제거한다.By placing the imaging array adjacent to the sample, the collection efficiency is more than 10 times improved over the lens based techniques found in conventional CCD cameras. That is, a sample (emitter) is contacted with a detector (imaging array) to remove conventional imaging optics such as lenses and mirrors.
방사능 동위원소가 리포터 그룹으로서 타겟 분자에 부착될 때 에너지가 높은 입자가 탐지된다. 다양한 에너지의 입자를 방출하는 몇 개의 리포터 그룹, 예컨대32P,33P,35S,14C 및125L이 미소 제조된 탐지기에 성공적으로 이용된다.32P와 같은 고에너지 입자는 최고의 분자탐지 민감도를 제공하지만35S와 같은 저에너지 입자는 더 양호한 해상도를 제공한다. 방사능동위원소 리포터가 필요에 따라 선택될 수 있다. 특별한 방사능동위원소 라벨이 선택되면 Egger(1994)에 의해 발표된 대로 신호대 잡음비(SNR)를 계산함으로써 탐지성능이 예측될 수 있다.Highly energetic particles are detected when radioactive isotopes are attached to target molecules as reporter groups. Several reporter groups that emit particles of various energies, such as 32 P, 33 P, 35 S, 14 C and 125 L, have been successfully used in microfabricated detectors. High energy particles, such as 32 P, offer the best molecular detection sensitivity, while low energy particles, such as 35 S, provide better resolution. Radioisotope reporters can be selected as needed. Once a particular radioisotope label is selected, detection performance can be predicted by calculating the signal-to-noise ratio (SNR) as published by Egger (1994).
발광성 탐지방법은 타겟 분자에 부착된 형광 또는 화학발광성 리포터 그룹을 사용한다. 형광성 라벨은 고유 결합되거나 상호작용을 통해 부착된다. 브롬화 에티듐과 같이 근 UV(300-350㎚)에서 센 흡수밴드와 가시광선(500-650㎚)에서 주 방출밴드를 갖는 형광 염료가 사용된 CCD 장치에 가장 적합한데, 그 이유는 양자 효율이 형광 신호 파장보다 활성화 파장에서 여러배 더 낮기 때문이다.Luminescent detection methods use fluorescence or chemiluminescent reporter groups attached to a target molecule. Fluorescent labels are inherently bound or attached through interaction. Best suited for CCD devices in which fluorescent dyes, such as ethidium bromide, have a strong absorption band in near UV (300-350 nm) and a main emission band in visible light (500-650 nm), because quantum efficiency is This is because it is many times lower at the activation wavelength than the fluorescence signal wavelength.
발광성 탐지 측면에서 폴리실리콘 CCD 게이트는 UV 범위의 입사광 기여를 여과할 용량을 가지지만 형광 리포터 그룹에 의해 발생된 가시광선 발광에 매우 민감하다. UV 활성화에 대한 이렇게 큰 판별성은 Egger(1994)에 의해 발표된대로 CCD에 의해 큰 SNR(100 이상)이 달성될 수 있게 한다.In terms of luminescence detection, polysilicon CCD gates have the capacity to filter the incident light contribution in the UV range, but are very sensitive to the visible light emission generated by the fluorescent reporter group. This large discriminant for UV activation allows a large SNR (over 100) to be achieved by the CCD as published by Egger (1994).
탐지기상의 프로브 부동화의 경우에 교잡 매트릭스를 값싼 SiO2웨이퍼상에서 생성할 수 있으며, 이것은 CCD 표면에 놓여서 교잡 및 건조된다. 이러한 포맷은 DNA 교잡이 값싼 일회용 SiO2웨이퍼상에서 수행되어 더 비싼 CCD 탐지기의 재사용을 허용하므로 경제적으로 효율적이다. 혹은, 프로브가 CCD 상에 직접 부동화되어서 전용 프로브 매트릭스를 생성할 수 있다.In the case of probe immobilization on the detector, a hybrid matrix can be produced on cheap SiO 2 wafers, which are placed on the CCD surface and hybridized and dried. This format is economically efficient as DNA hybridization is performed on cheap disposable SiO 2 wafers to allow reuse of more expensive CCD detectors. Alternatively, the probe can be immobilized directly on the CCD to create a dedicated probe matrix.
SiO2코팅상에 프로브를 부동화하기 위해서 에폭시-실란 시약과 표준 SiO2변성화학을 사용하여 균일한 에폭사이드층이 필름 표면에 연결된다. 이후에 에폭사이드링을 갖는 2차 아민 조성물을 수단으로 아민 변성 올리고누클레오티드 프로브가 SiO2표면에 연결된다. 결과의 연결은 3 염기 올리고누클레오티드와 SiO2표면간에 17개의 회전가능한 분리 결합을 제공한다. 아민의 양성자를 완전 제거하여 커플링 동안 2차 구조 형성을 최소화하기 위해서 반응이 0.1M KOH에서 수행되고 6시간동안 37℃에서 배양되는 것이 좋다.A uniform epoxide layer is connected to the film surface using an epoxy-silane reagent and standard SiO 2 modification chemistry to immobilize the probe on the SiO 2 coating. The amine modified oligonucleotide probe is then connected to the SiO 2 surface by means of a secondary amine composition having an epoxide ring. The resulting linkage provides 17 rotatable separation bonds between the three base oligonucleotides and the SiO 2 surface. In order to completely remove the protons of the amine to minimize secondary structure formation during coupling, the reaction is preferably carried out at 0.1 M KOH and incubated at 37 ° C. for 6 hours.
포맷 3 SBH에서 1억(bp)마다 신호가 스코링된다. 한번에 모든 배열(4000 5 ×5㎜)을 교잡할 필요가 없으며 더 적은 수의 배열을 연속 사용할 수 있다.In Format 3 SBH, the signal is scored every 100 million (bp). There is no need to hybridize all the arrays (4000 5 x 5 mm) at a time and fewer arrays can be used continuously.
주기적 교잡반응은 교잡 신호를 증가시키는 한가지 방법이다. 한 싸이클에서 고정된 프로브의 대부분은 표지된 프로브에 대해 비상보적인 테일 서열을 갖는 DNA 단편과 교잡한다. 온도를 증가시킴으로써 하이브리드는 용융된다. 다음 싸이클에서 일부(∼0.1%)는 적절한 DNA 단편과 교잡하고 추가 표지된 프로브가 연결된다. 이 경우에 두 프로브 세트에 불일치하는 DNA 하이브리드의 구별되는 용융이 일어난다.Periodic hybridization is one way of increasing the hybridization signal. Most of the probes immobilized in one cycle hybridize with DNA fragments having tail sequences that are not complementary to the labeled probes. By increasing the temperature, the hybrid melts. In the next cycle, some (˜0.1%) hybridize with the appropriate DNA fragment and additional labeled probes are linked. In this case, a distinct melting of the DNA hybrid that is inconsistent with the two probe sets occurs.
싸이클 교잡에서 싸이클링 개시전 모든 성분이 T4에 대해서는 37℃, 열안정성 리가아제에 대해선 더 고온에서 첨가된다. 이후에 온도가 15-37℃로 감소되고 칩이 최대 10분간 배양되고 이후에 수분간 37℃ 이상으로 온도가 증가되고 다시 감소된다. 싸이클은 최대 10회 반복된다. 한 변형에서 싸이클링없이 최적의 더 높은 온도(10-50℃)가 사용되면 더 긴 연결 반응이 수행될 수 있다(1-3시간).In cycle hybridization, all components prior to initiation of cycling are added at 37 ° C. for T4 and at higher temperatures for thermostable ligase. The temperature is then reduced to 15-37 ° C. and the chip is incubated for up to 10 minutes, after which the temperature is increased above 37 ° C. for several minutes and then reduced. The cycle can be repeated up to 10 times. In one variant, longer optimal coupling reactions can be carried out (1-3 hours) if an optimal higher temperature (10-50 ° C.) is used without cycling.
여기서 기술된 절차는 비교적 소수의 올리고누클레오티드가 필요하므로 표준 합성 및 올리고누클레오티드의 정확한 스포팅을 사용하여 복잡한 칩 제조를 가능하게 한다. 예컨대 모든 7-mer 올리고가 합성된다면 (16384 프로브) 2억5천6백만의 14-mer 리스트가 결정될 수 있다.The procedure described herein requires relatively few oligonucleotides, thus enabling complex chip fabrication using standard synthesis and accurate spotting of oligonucleotides. For example, if all 7-mer oligos were synthesized (16384 probes) a 260 million 14-mer list could be determined.
또다른 변형은 베이스 배열마다 하나 이상의 상이하게 표지된 프로브를 사용하는 것이다. 이것은 두가지 목적으로 수행된다; 별도로 교잡된 배열의 수를 감소시키는 멀티플렉싱 또는 3 ×6 또는 3 ×7과 같은 더 긴 올리고 서열 리스트를 결정하는 것. 이 경우에 두 개의 라벨이 사용되면 3개의 연속 올리고누클레오티드의 특이성은 포지티브 사이트가 두 라벨에 대해 충분한 신호를 가져야 하므로 거의 절대적이다.Another variation is to use one or more differently labeled probes per base array. This is done for two purposes; Determining multiplexing or lists of longer oligo sequences, such as 3 × 6 or 3 × 7, to reduce the number of separately hybridized arrays. If two labels are used in this case, the specificity of three consecutive oligonucleotides is almost absolute since the positive site must have sufficient signal for both labels.
또다른 변형예는 BxNy(y는 1 내지 4)을 포함한 칩을 사용하는 것이다. 이러한 칩은 상이한 프레임에서 서열 판독을 허용한다. 이것은 또한 적절한 라벨링된 프로브 세트를 사용하여 달성되거나 F와 P 프로브 둘다가 비특이성 단부 위치(즉 일부 말단 축퇴 요소)를 가질 수 있다. 링커의 일부로서 한정된 서열의 프로브를 고체 담체에 연결시키기 위해서 범용 베이스가 사용될 수도 있다. 이것은 프로브를 교잡에 더 많이 이용하게 하여서 구조를 더욱 안정시킨다. 프로브가 5개 염기를 가지는 경우에 3개의 범용 염기가 링커로서 사용할 수 있다(도 4).Another variant is to use a chip containing BxNy (y is 1 to 4). Such chips allow sequence readings in different frames. This may also be achieved using a suitable set of labeled probes or both F and P probes may have non-specific end positions (ie some terminal degenerate elements). A universal base may also be used to link the probe of defined sequence to the solid carrier as part of the linker. This makes the probe more used for hybridization, making the structure more stable. If the probe has five bases, three universal bases can be used as the linker (FIG. 4).
실시예 16: 교잡 데이타로 부터 서열 결정Example 16: Sequence Determination from Hybridization Data
주어진 중첩(N-1)머가 두번 이상 중복될 경우에 서열 어셈블 리가 간섭받을 수 있다. 그러면 마지막 누클레오티드에서 상이한 두 개의 N-머중 하나가 서열 연장에 사용될 수 있다. 이러한 분지점은 서열의 명백한 어셈블리를 제한한다.Sequence assembly may interfere if a given overlap (N-1) mer overlaps more than once. One of two different N-mers in the last nucleotide can then be used for sequence extension. This branch point limits the apparent assembly of the sequence.
타겟 핵산의 완벽한 서열을 위해서 타겟 핵산에 교잡하는 공지 올리고누클레오티드의 서열 재어셈블링은 어떤 경우에 수행될 수 없다. 이것은 타겟 핵산이 교잡에 사용된 올리고누클레오티드의 크기에 비해서 적절한 크기의 조각 상태가 아닐 경우 일부 정보가 손실될 수 있기 때문이다. 손실된 정보의 양은 서열화되는 타겟의 길이에 비례한다. 그러나 충분히 짧은 타겟이 사용되면 서열이 명백하게 결정될 수 있다.Sequence reassembly of known oligonucleotides that hybridize to a target nucleic acid for the complete sequence of the target nucleic acid cannot be performed in any case. This is because some information may be lost if the target nucleic acid is not fragmented to an appropriate size relative to the size of the oligonucleotide used for the hybridization. The amount of information lost is proportional to the length of the target being sequenced. However, if a sufficiently short target is used, the sequence can be determined explicitly.
특정길이의 DNA를 따라 분포된 서열 어셈블리와 간섭하는 중복서열 발생빈도가 계산될 수 있다. 이것은 서열 조직화를 해야 하는 매개변수 정의의 도입을 요한다: 서열 서브프래그먼트(SF). 서열 서브프래그먼트는 타겟 핵산 서열의 어느 부분이 타겟 서열내에서 두회이상 반복된 (N-1)머로 시작 및 종료하는지를 결정한다. 따라서 서브프래그먼트는 본 발명의 방법에서 서열 어셈블리 과정에서 두 개의 분지지점간에 발생된 서열이다. 모든 서브프래그먼트의 합은 중첩된 짧은 단부로 인해 실제 핵산보다 길다. 일반적으로 서브프래그먼트는 단부 및 시작점에서 (N-1)머를 공유하므로 추가 정보가 없다면 선형 순서로 어셈블링될 수 없다. 반복된 (N-1)머의 숫자에 따라서 각 핵산 타겟에 대해 상이한 갯수의 서브프래그먼트가 수득된다. 이 수치는 N-1과 타겟의 길이에 달려있다.The incidence of duplicate sequences that interfere with sequence assemblies distributed along a particular length of DNA can be calculated. This requires the introduction of parameter definitions that must be sequence organized: sequence subfragment (SF). The sequence subfragment determines which portion of the target nucleic acid sequence starts and ends with a (N-1) mer repeated more than once in the target sequence. Thus, subfragments are sequences generated between two branching points during sequence assembly in the method of the invention. The sum of all subfragments is longer than the actual nucleic acid due to the overlapping short ends. In general, the subfragments share the (N-1) mer at the end and the starting point and thus cannot be assembled in a linear order without additional information. Depending on the number of repeated (N-1) mers, different numbers of subfragments are obtained for each nucleic acid target. This figure depends on the length of N-1 and the target.
확률 계산으로 두 인자의 상호관계를 평가할 수 있다. 길이 N-1의 중첩 서열을 사용하거나 평균 거리 Ao에서 양의 N-머의 서열화가 수행되면 프래그먼트 Lf 베이스 길이의 N-1은 식 Nsf= 1 + Ao×K ×P(K, Lf)로 주어진다.Probability calculations allow us to evaluate the correlation of two factors. Length N-1 using the nested sequence or the average distance A o of the ranking of the two N- Murray fragment when performed on N-1 of the base length, Lf formula N sf = 1 + A o × K × P (K, L of f )
K가 2이상일 경우에 P(K, Lf)는 프래그먼트 Lf 베이스 길이상에서 N-머가 K번 발생할 확률을 나타낸다. 또한 주어진 서열에 대해 N-머로 부터 서브프래그먼트를 형성할 수 있는 컴퓨터 프로그램이 실시예 18 에 기술된다.If K is 2 or more, P (K, L f ) represents the probability that N-mers occur K times on the fragment Lf base length. Also described in Example 18 is a computer program capable of forming subfragments from N-mers for a given sequence.
주어진 프로브 길이에서 프래그먼트 길이가 길수록 서브프래그먼트의 갯수가 증가한다. 수득된 서브프래그먼트는 고유하게 서열화될 수 없다. 완전하지는 않지만 이 정보는 기능성 서열의 인식 및 비교 서열분석에 매우 유용하다. 이러한 종류의 정보를 부분 서열이라 부른다. 부분 서열을 얻는 또다른 방법은 주어진 길이의 올리고누클레오티드 프로브의 서브세트만을 사용하는 것이다.The longer fragment length at a given probe length increases the number of subfragments. The subfragments obtained cannot be uniquely sequenced. Although not complete, this information is very useful for recognition and comparative sequencing of functional sequences. This kind of information is called partial sequence. Another way of obtaining partial sequences is to use only a subset of oligonucleotide probes of a given length.
랜덤 DNA 서열에 대한 이론과 컴퓨터 모의실험에 따른 예측된 서열간에는 꽤 잘 일치한다. 예컨대 N-1 = 7(8-머나 16개의 5'(A,T,C,G) B8(A,T,C,G) 3' 10-머를 사용하는)일 경우에서 200염기의 타겟 핵산은 평균 3개의 서브프래그먼트를 가진다. 그러나, 평균값 주위의 분산 때문에 타겟 핵산 라이브러리는 2000 타겟에서 1개 미만이 3개 이상의 서브프래그먼트를 가지도록 500bp의 인서트를 가진다. 따라서 랜덤 서열의 긴 핵산 서열 측정의 이상적인 경우에 충분히 짧은 타겟핵산 인서트를 갖는 라이브러리가 사용될 수 있다. 이러한 인서트의 경우 본 방법에 의해 각 타겟을 재구축할 수 있다. 큰 핵산의 전체 서열은 한정된 각 인서트 서열의 중첩에 의해 수득된다.There is a good agreement between the theory of random DNA sequences and the predicted sequences from computer simulations. 200 base targets, for example when N-1 = 7 (using 8-mers or 16 5 '(A, T, C, G) B 8 (A, T, C, G) 3' 10-mers) Nucleic acids have an average of three subfragments. However, because of the variance around the mean value, the target nucleic acid library has an insert of 500 bp so that less than 1 has at least 3 subfragments at 2000 targets. Thus, libraries with short enough target nucleic acid inserts can be used in ideal cases of long nucleic acid sequencing of random sequences. For such inserts, each target can be rebuilt by this method. The entire sequence of large nucleic acids is obtained by overlapping each defined insert sequence.
매우 짧은 프래그먼트, 예컨대 8-머 프로브의 경우 50염기의 필요성을 감소시키기 위해서 클로닝과 같은 랜덤 DNA 프래그먼트화 공정이나 랜덤 PCR에 존재하는 중첩된 프래그먼트에 포함된 정보가 사용된다. 또한 짧은 물리적 핵산 프래그먼트 푸울을 사용할 수 있다. 20,000의 50bp 프래그먼트 대신에 1메가베이스 서열화를 위해 5' (A,T,C,G) N8 (A,T,C,G) 3' 과 같은 11-머 또는 8-머를 사용하면 단지 2100개의 샘플이면 충분하다. 이 수치는 700개의 랜덤 7kb 클론 (기본 라이브러리), 500bp 20 클론의 1250 푸울 (서브프래그멘트 서열화라이브러리) 및 점핑 라이브러리에서 나오는 150클론으로 구성된다. 개발된 알고리즘(실시예 18)은 기술된 샘플의 교잡 데이타를 사용하여 서열을 발생한다.In the case of very short fragments, such as 8-mer probes, information contained in overlapping fragments present in random PCR fragmentation processes such as cloning or random PCR is used to reduce the need for 50 bases. Short physical nucleic acid fragment pools can also be used. Using 11-mers or 8-mers such as 5 '(A, T, C, G) N8 (A, T, C, G) 3' for 1 megabase sequencing instead of 20,000 50bp fragments, only 2100 A sample is enough. This figure consists of 700 random 7 kb clones (base library), 1 500 pools of 500 bp 20 clones (subfragment sequencing library) and 150 clones from the jumping library. The developed algorithm (Example 18) generates a sequence using the hybridization data of the described sample.
실시예 17: 알고리즘Example 17: Algorithm
이 실시예는 출발 핵산서열의 최소 갯수의 분리된 무작위 한정된 단편내 구성 K-집합 단어(K는 올리고누클레오티드 프로브의 길이)로 부터 4문자 알파벳으로 씌여진 긴 서열의 발생을 위한 알고리즘을 기술한다. 이 알고리즘은 교잡(SBH) 공정에 의한 서열화에 주로 사용된다. 이 알고리즘은 소단편(SF), 정보단편(IF) 및 정보단편 정의를 위해 물리적 핵산 서열 푸울을 사용할 가능성에 기초한다.This example describes an algorithm for the generation of long sequences written in the four letter alphabet from the minimum number of separated randomly defined constituent K-set words (K is the length of the oligonucleotide probe) of the starting nucleic acid sequence. This algorithm is mainly used for sequencing by hybridization (SBH) process. This algorithm is based on the possibility of using physical nucleic acid sequence pools for small fragment (SF), information fragment (IF) and information fragment definition.
소단편은 타겟 핵산에서 K-1 올리고머 서열의 반복으로 인해 어셈블리 과정에서 분지점에 의해 초래될 수 있다. 소단편은 서열에서 발생하는 길이 K-1의 두 반복단위간에 발견되는 서열 단편이다. K-1 단어의 다중 발생은 서열생성 과정에서 K-단어의 중첩 서열화의 간섭 원인이다. 간섭은 소단편 형태로 남아있는 서열을 가져온다. 따라서 서열이 고유하게 결정되지 않은 분지점간의 명백한 세그멘트를 서열 소단편이라 부른다.Small fragments may be caused by branching points in the assembly process due to repetition of the K-1 oligomer sequence in the target nucleic acid. Small fragments are sequence fragments found between two repeat units of length K-1 occurring in the sequence. Multiple occurrences of the K-1 word are a source of interference in the overlapping sequencing of K-words during sequencing. Interference results in sequences remaining in the form of small fragments. Thus, the apparent segment between branches where the sequence is not inherently determined is called the sequence small fragment.
정보단편은 중첩된 물리적 서열 단편의 최근 단부에 의해 결정된 서열 단편으로 정의된다.An information fragment is defined as a sequence fragment determined by the most recent end of the overlapping physical sequence fragment.
정보단편 한정 가능성을 손실함이 없이 특정수의 물리적 단편이 모여질 수 있다. 무작위로 모여진 단편의 총길이는 서열 과정에 사용된 K-집합의 길이에 달려있다.A certain number of physical fragments can be gathered without losing the possibility of information fragmentation. The total length of the randomly gathered fragments depends on the length of the K-set used in the sequence process.
알고리즘은 두 개의 주 단위로 구성된다. 제 1 부분은 서열에 포함된 K- 집합으로 부터 소단편 발생에 사용된다. 소단편은 특정 크기의 물리적 핵산서열의 코딩 지역내 또는 긴 핵산서열내 한정된 정보 단편내에 발생될 수 있다. 두 종류의 단편이 기본 라이브러리의 구성요소이다. 이 알고리즘은 기본 라이브러리의 정보단편 K-집합의 내용 결정을 기술하지 않는다. 즉 서열 발생 과정에 사용될 정보단편 제조단계를 기술하지 않는다.The algorithm consists of two main units. The first part is used to generate small fragments from the K-collections contained in the sequence. Small fragments may occur within coding regions of physical nucleic acid sequences of a particular size or within defined information fragments within long nucleic acid sequences. Two kinds of fragments are components of the base library. This algorithm does not describe the determination of the contents of the information fragment K-sets in the base library. That is, it does not describe the information fragment manufacturing steps to be used in the sequence generation process.
알고리즘의 제 2 부분은 기본 라이브러리의 핵산단편의 완전 서열을 재발생할 목적으로 수득된 소단편의 선형 순서를 결정한다. 이러한 목적으로 무작위로 모은 출발서열의 단편으로 제조된 제 2 순서화 라이브러리가 사용된다. 이 알고리즘은 전체 메가베이스 플러스 서열을 재발생하는 기본 단편 서열 조합단계를 포함하지 않는다. 이것은 정보 단편 발생에 필수적인 기본 라이브러리의 단편 연결을 사용하여 수행될 수 있다. 혹은, 공통 단부-서열에 기초하여 중첩을 탐지하여 알고리즘에 의해 기본 라이브러리 단편의 서열을 발생한 후 수행될 수 있다.The second part of the algorithm determines the linear order of the small fragments obtained for the purpose of regenerating the complete sequence of the nucleic acid fragments of the base library. For this purpose a second ordered library made from fragments of randomly collected starting sequences is used. This algorithm does not include a base fragment sequence combining step that regenerates the entire megabase plus sequence. This can be done using fragment linkage of the underlying library, which is essential for generating information fragments. Alternatively, the detection may be performed after generating the sequence of the base library fragment by an algorithm by detecting the overlap based on the common end-sequence.
이 알고리즘은 기본 및 순서화 라이브러리의 핵산 서열에서 주어진 k-집합 발생횟수에 대한 지식을 필요로 하지 않으며 k-집합 단어가 단편의 단부에 존재한다는 정보도 요구하지 않는다. 이 알고리즘은 다양한 길이의 k-집합의 혼성된 내용으로 작동한다. 이 알고리즘의 개념은 그릇된 양 및 음의 k-집합을 포함하는 k-집합으로 작동시킬 수 있게 한다. 특별한 경우에만 그릇된 k-집합의 내용이 발생된 서열의 정확성에 영향을 준다. 이 알고리즘은 모의실험에서 매개변수의 최적화와 실제 SBH 실험에서 서열발생, 예컨대 유전자 DNA 서열의 발생을 위해 사용될 수 있다. 매개변수 최적화시 실제적이고 편리한 단면을 위해 올리고누클레오티드 프로브(k-집합)의 선택 또는 한정된 프로브를 위해 단편의 최적의 길이 및 갯수 선택이 특히 중요하다.This algorithm does not require knowledge of the number of k-set occurrences given in the nucleic acid sequences of the basic and ordered libraries, nor does it require information that the k-set words are at the end of the fragment. This algorithm works with hybrid content of k-sets of varying lengths. The concept of this algorithm makes it possible to operate with k-sets that include wrong positive and negative k-sets. Only in special cases the content of the wrong k-set affects the accuracy of the sequence generated. This algorithm can be used for optimization of parameters in simulations and for sequence generation in real SBH experiments, such as for generation of genetic DNA sequences. Selection of oligonucleotide probes (k-sets) or optimal length and number of fragments for the limited probes is particularly important for practical and convenient cross sections in parameter optimization.
알고리즘의 이 부분은 k-집합 내용으로 부터 서열을 발생하는 과정에 중심 역할을 한다. 이것은 최대 중첩을 수단에 의한 k-집합의 고유한 순서매김에 기초한다. 서열 발생의 주 장애는 특수한 반복 서열과 그릇된 양 또는 음의 k-집합이다. 알고리즘중 이 부분의 목적은 올바른 서열로 최소 갯수의 최대로 긴 소단편을 수득하는 것이다. 알고리즘의 이 부분은 하나의 기본 단계와 여러개의 제어단계로 구성된다. 어떤 정보는 모든 주 소단편의 발생후에만 사용될 수 있으므로 2단계 과정이 필요하다.This part of the algorithm plays a central role in the generation of sequences from the k-set contents. This is based on the unique ordering of the k-sets by means of maximum overlap. The main obstacle to sequence development is the special repeating sequence and the wrong positive or negative k-set. The purpose of this part of the algorithm is to obtain the minimum number of maximum long fragments with the correct sequence. This part of the algorithm consists of one basic step and several control steps. Some information is only available after every address fragment has occurred, so a two-step process is necessary.
서열 발생의 주문제점은 정의에 의해 특정 k-집합의 발생 횟수에 대한 정보를 갖지 않은 단어 내용으로 부터 반복된 서열을 수득하는 것이다. 전체 알고리즘의 개념은 이러한 문제가 해결되는지 여부에 달려 있다. 원리상 두가지 상반된 방법이 있다: 1) pSF 발생과정에서 반복된 서열이 초기에 수득되는 것, 2) 소단편 최종 순서매김 과정에서 반복된 서열이 나중에 수득되는 것. 첫 번째 경우에 pSF는 과잉 서열을 포함하고 두 번째 경우에 서열이 부족하다. 첫 번째 방법은 발생된 과잉 서열의 제거를 요하며 두 번째 방법은 서열 최종 어셈블링 과정에서 일부 소단편을 여러번 사용할 것을 요한다.The challenge of sequence generation is to obtain a repeated sequence from the word content that, by definition, does not have information about the number of occurrences of a particular k-set. The concept of the whole algorithm depends on whether this problem is solved. In principle there are two opposing methods: 1) the repeated sequence is initially obtained during pSF generation, and 2) the repeated sequence is obtained later in the small fragment final sequencing process. In the first case the pSF contains excess sequence and in the second case there is a lack of sequence. The first method requires the removal of the excess sequence generated and the second method requires the use of some small fragments several times during sequence final assembly.
두 방법의 차이점은 k-집합의 고유한 중첩 규칙의 정밀도에 있다. 덜 정밀한 규칙은 k-집합 X의 최우측 k-1 단부가 k-집합 Y의 가장 왼쪽 단부에 존재할 경우에만 k-집합 X이 k-집합 Y와 최대로 중첩된다. 이 규칙은 반복 서열발생 및 잉여 서열의 형성을 허용한다.The difference between the two methods lies in the precision of the inherent nesting rules of the k-set. A less precise rule is that k-set X overlaps maximally with k-set Y only if the rightmost k-1 end of k-set X is at the leftmost end of k-set Y. This rule allows for repetitive sequencing and formation of excess sequences.
두 번째 방법에서 사용된 더 엄격한 규칙은 첨가절차가 있다: k-집합 X의 최우측 k-1 단부가 k-집합 Y의 가장 왼쪽에 존재할 경우와 k-집합 Y의 가장 왼쪽의 k-1 단부가 다른 k-집합의 최우측 단부에 존재하지 않을 경우에만 k-집합 X가 k-집합 Y와 최대로 중첩된다. 더 엄격한 규칙에 기초한 알고리즘이 더 간단하다.The stricter rule used in the second method is the addition procedure: when the rightmost k-1 end of k-set X is at the far left of k-set Y and the leftmost k-1 end of k-set Y K-set X overlaps maximally with k-set Y only if is not present at the rightmost end of the other k-set. Algorithms based on stricter rules are simpler.
주어진 소단편의 신장과정은 포함된 마지막 k-집합 우측 k-1 단부가 모든 k-집합의 왼쪽 단부에 존재하지 않거나 두 개 이상의 k-집합에 존재할 때 중단된다. 단지 하나의 k-집합에만 존재하면 규칙의 제 2 부분이 테스트된다. 첨가시 앞서 포함된 것과 상이한 k-집합이 있다면 주어진 소단편의 어셈블리는 첫 번째 가장 왼쪽 위치에서만 종결된다. 추가적 k-집합이 존재하지 않으면 고유한 k-1 중첩에 대한 조건이 충족되므로 소단편이 한 요소만큼 우측으로 확장된다.The stretching process of a given small fragment is stopped when the last k-set right k-1 end involved does not exist at the left end of all k-sets or is present in more than one k-set. If only one k-set exists, the second part of the rule is tested. If there are k-sets different from those previously included in addition, the assembly of a given small fragment terminates only in the first leftmost position. If no additional k-set exists, the condition for unique k-1 overlap is met, so the small fragment extends to the right by one element.
기본 규칙 이외에도 상이한 길이의 k-집합 사용을 위해 상보적인 규칙이 사용된다. 최대 중첩은 중첩쌍의 더 짧은 k-집합의 k-1의 길이이다. k-집합이 핵산 서열의 순서와는 무관하게 무작위로 표시되는 파일에서 나온 제 1 k-집합으로 부터 시작하여 pSF의 발생이 수행된다. 따라서, 파일의 제 1 k-집합은 서열의 시작부나 특정 소단편의 시작부에 있을 필요가 없다. 소단편 발생공정은 기술된 규칙에 의해 한정된 고유한 중첩에 의해 k-집합의 순서를 매김으로써 수행된다. 사용된 k-집합은 파일로 부터 삭제된다. 마지막 포함된 것과 중첩된 k-집합이 더 이상 없을 때 소단편 구축이 종료되고 또다른 pSF 구축이 시작된다. 대부분의 소단편 발생은 실제 시작부에서 개시되지 않으므로 형성된 pSF가 k-집합 파일에 첨가되고 더 긴 k-집합으로 간주된다. 또다른 가능성은 출발 k-집합으로 부터 양방향으로 진행하는 소단편을 형성하는 것이다. 이 과정은 추가 중첩, 즉 소단편의 연장이 불가능해질 때 끝난다.In addition to the basic rules, complementary rules are used for the use of k-sets of different lengths. The maximum overlap is the length of k-1 of the shorter k-sets of the overlapping pairs. The generation of pSF is performed starting from the first k-set from the file where the k-set is randomly presented regardless of the sequence of the nucleic acid sequences. Thus, the first k-set of the file need not be at the beginning of the sequence or at the beginning of a particular small fragment. The small fragment generation process is performed by ordering the k-sets by unique overlap defined by the rules described. The k-set used is deleted from the file. When there is no longer a k-set nested with the last included, the short fragment construction ends and another pSF construction begins. Most small fragment generations do not start at the beginning, so the formed pSF is added to the k-set pile and is considered a longer k-set. Another possibility is to form small fragments that run in both directions from the starting k-set. This process ends when further overlapping, i.e., the extension of the small fragments, becomes impossible.
pSF는 3개의 그룹으로 나뉠 수 있다: 1) 정확한 k-집합의 경우에 최대 길이 및 올바른 서열의 소단편; 2) 불완전한 집합 또는 그릇된 양의 k-집합을 갖는 집합에 대한 최대 중첩 규칙의 사용으로 형성된 짧은 소단편; 3) 부정확한 서열의 pSF. 2)에서 집합의 불완전성은 교합실험의 그릇된 음의 결과나 부정확한 k-집합의 사용에 의해 초래된다. 이들은 그릇된 양 및 음의 k-집합 때문에 형성되며 a) 잘못 연결된 소단편; b) 잘못된 단부를 갖는 소단편; c) 그릇된 최소 소단편으로 나타나는 그릇된 양의 k-집합일 수 있다.pSF can be divided into three groups: 1) small fragments of maximum length and correct sequence in case of correct k-sets; 2) short fragments formed from the use of maximum overlapping rules for incomplete sets or sets with wrong amounts of k-sets; 3) pSF of incorrect sequence. The incompleteness of the set in 2) is caused by the wrong negative result of the occlusion experiment or the use of an incorrect k-set. They are formed because of wrong positive and negative k-sets and a) misconnected small fragments; b) small fragments with wrong ends; c) can be the wrong amount of k-sets represented by the wrong smallest fragment.
그릇된 양의 k-집합의 경우에 중앙에 하나의 잘못된 염기를 포함하거나 하나 이상의 잘못된 염기를 포함하는 k-집합 존재가능성과 단부에 잘못된 염기를 갖는 k-집합 존재가능성이 있다. 짧고 잘못 연결된 소단편 발생은 후자 k-집합에 의해 야기된다. 전자의 두 종류의 k-집합은 k-집합 길이와 동일한 길이의 잘못된 pSF를 나타낸다.In the case of wrong amounts of k-sets, there is the possibility of a k-set containing one wrong base in the middle or one or more wrong bases and a k-set having the wrong base at the end. Short, misconnected small fragments are caused by the latter k-set. The former two kinds of k-sets represent wrong pSFs of the same length as the k-set lengths.
그릇된 음의 k-집합의 경우에 최대 중첩이 불가능하므로 pSF가 발생된다. 가장 왼쪽 또는 최우측 단부상에 잘못된 염기를 갖는 그릇된 양의 k-집합의 경우에 명백한 중첩이 불가능하므로 pSF가 발생된다. 공통 k-1 서열을 갖는 그릇된 양 및 음의 k-집합이 파일에 존재할 경우에 pSF가 발생되며 pSF중 하나는 관련 단부에서 잘못된 k-집합을 포함한다.In the case of a false negative k-set, the maximum overlap is not possible, resulting in pSF. In the case of a wrong amount of k-sets with wrong base on the leftmost or rightmost end, pSF is generated since no apparent overlap is possible. PSF is generated if there are wrong positive and negative k-sets with consensus k-1 sequences in the file and one of the pSFs contains an incorrect k-set at the relevant end.
서열의 오류가 있는 소단편 수정 공정과 연결된 pSF의 결합은 소단편 발생후 소단편 순서매김 공정에서 수행된다. pSF의 명백한 연결에 의해 최종 소단편을 수득하고 잘못 연결된 pSF를 잘라내는 제 1 단계가 아래에 기술된다.The binding of the pSF linked to the erroneous small fragment modification process of the sequence is performed in the small fragment sequencing process after small fragment generation. The first step of obtaining the final small fragment by means of explicit linkage of the pSF and cutting off the mislinked pSF is described below.
잘못 연결된 소단편 형성방법은 두가지이다. 첫 번째 길이 k-1의 반복된 서열 어셈블리 지점에서 오류가 있는 k-집합이 발생할 때 실수가 발생한다. 둘째, 반복된 서열이 k-1보다 짧을 때 일어난다. 이들 상황은 각각 두가지 변형으로 일어날 수 있다. 첫 번째 변형에서 반복된 서열중 하나가 단편의 단부를 나타낸다. 두 번째 변형에서 반복된 서열이 단편내 임의의 위치에서 발생한다. 첫 번째 경우에 파일에 일부 k-집합의 부재(그릇된 음의)는 잘못 연결을 시키는데 필요하다. 두 번째 경우는 파일에 그릇된 양 및 음의 k-집합 존재를 필요로 한다. k-1 서열의 반복의 경우에 한 단부가 내부적으로 반복될 때 단지 하나의 k-집합 부족이면 충분하다. 두 개의 부족은 엄격한 내부 반복의 경우에 필요하다. 그 이유는 서열의 단부가 그릇된 음의 k-집합의 무한 선형 배열로서 간주될 수 있기 때문이다. "k-1보다 적은 경우" 두 개 또는 세 개의 오류가 있는 k-집합을 요구하는 k-2 길이의 반복된 서열이 고려된다. 이들은 실제 실험에서 탐지되며 다른 경우는 덜 빈번하다.There are two ways to form the wrong fragments. Mistakes occur when an erroneous k-set occurs at repeated sequence assembly points of first length k-1. Second, it occurs when the repeated sequence is shorter than k-1. Each of these situations can occur in two variants. One of the sequences repeated in the first modification represents the end of the fragment. In the second modification the repeated sequence occurs at any position in the fragment. In the first case, the absence of some k-sets (false negatives) in the file is necessary to make the wrong connection. The second case requires the presence of wrong positive and negative k-sets in the pile. In the case of repetition of the k-1 sequence, only one k-set lack is sufficient when one end is internally repeated. Two shortages are needed in the case of strict internal iterations. The reason is that the ends of the sequence can be regarded as an infinite linear array of wrong negative k-sets. Repeated sequences of length k-2 that require two or three erroneous k-sets are considered "when less than k-1." These are detected in real experiments and less frequently in other cases.
반복된 서열이 단편의 단부에서 나타나지 않을 때 잘못 연결된 소단편의 인식은 더욱 엄격하게 한정된다. 이러한 상황에서 두 개의 소단편을 추가로 탐지할 수 있는데, 그중 하나는 잘못 연결된 소단편에 역시 존재하는 가장 왼쪽 단부 k-2 서열을, 다른 하나는 최우측 단부 k-2 서열을 포함한다. 반복된 서열이 단편의 단부상에 있을 때 k-2 서열을 포함하여 최우측 또는 가장 왼쪽 단부상에 소단편 형성시 실수를 초래하는 하나의 소단편이 있다.Recognition of mislinked small fragments is more strictly limited when repeated sequences do not appear at the end of the fragment. In this situation two further fragments can be detected, one of which contains the leftmost end k-2 sequence, which is also present in the misconnected small fragment, and the other contains the rightmost end k-2 sequence. When the repeated sequence is on the end of the fragment, there is one small fragment that causes a mistake in forming the small fragment on the rightmost or leftmost end, including the k-2 sequence.
절단에 의한 잘못 연결된 소단편의 제거는 다음 규칙에 따라 수행된다: 길이 k-2의 소단편의 가장 왼쪽 또는 최우측 서열이 다른 소단편에 존재하면 이 소단편이 두 개의 소단편으로 절단되고 각각은 k-2 서열을 포함한다. 이 규칙은 반복된 k-1 서열의 지점에서 하나 이상의 그릇된 음의 k-1 집합이 있을 때 반복된 단부에 대해서는 적용되지 못한다. 이러한 형태의 잘못 연결된 소단편은 중첩된 단편의 정보나 기본 및 순서매김 라이브러리의 정보 단편을 사용하여 인식될 수 있다. 추가로, 두 개 이상의 잘못된 음의 k-집합이 동일한 k-1 서열을 포함하는 두 지점에서 발생할 때 잘못 연결된 소단편은 유지된다. 이것은 매우 드문 상황인데, 그 이유는 적어도 4개의 특정 잘못된 k-집합을 필요로 하기 때문이다. 주어진 서열이 한 소단편의 단부로 부터 k-2보다 짧은 서열을 또다른 시작부와 조합하여 수득될 수 있다면 길이 k의 서열상의 소단편을 절단하도록 추가규칙이 도입될 수 있다.Removal of incorrectly linked small fragments by cleavage is performed according to the following rules: If the leftmost or rightmost sequence of small fragments of length k-2 is present in the other small fragments, the small fragments are cut into two small fragments and each Comprises a k-2 sequence. This rule does not apply to repeated ends when there is one or more false negative k-1 sets at points of the repeated k-1 sequence. Mismatched subfractions of this type can be recognized using information from nested fragments or from information fragments from basic and ordered libraries. In addition, poorly linked small fragments are maintained when two or more false negative k-sets occur at two points that contain the same k-1 sequence. This is a very rare situation because it requires at least four specific wrong k-sets. Additional rules can be introduced to cut small fragments on a sequence of length k if a given sequence can be obtained by combining a sequence shorter than k-2 from the end of one small fragment with another beginning.
기술된 규칙의 엄격한 적용에 의해서 출력의 정확도를 보장하도록 일부 완전성이 손실된다. 일부 소단편은 잘못 연결된 소단편의 패턴에 들어맞으므로 잘못 연결되지 않더라도 절단될 것이다. 여러 가지 상황이 있다. 예컨대, 적어도 두 개의 동일한 k-1 서열뿐만 아니라 단편은 k-1로 부터 임의의 k-2 서열을 포함하거나 적어도 두 번 반복된 k-2 서열을 포함하여 적어도 하나의 잘못된 음의 k-집합은 중앙에 k-2 서열을 포함한다.Strict application of the described rules results in a loss of some integrity to ensure the accuracy of the output. Some small fragments will fit into the pattern of misconnected small fragments and will be cut even if they are not mislinked. There are several situations. For example, the fragment as well as the at least two identical k-1 sequences may comprise any k-2 sequence from k-1 or at least one incorrect negative k-set comprising at least two repeated k-2 sequences. It contains the k-2 sequence in the center.
이 알고리즘의 목적은 pSF의 수를 서열이 올바른 더 긴 최소 갯수의 소단편으로 감소시키는 것이다. 더 긴 소단편 또는 완전한 서열의 발생은 두가지 상황에서 가능하다. 첫 번째 상황은 반복된 k-1 단어의 특정 순서에 관계된다. 일부 또는 모든 최대로 연장된 pSF(제 1 그룹)는 고유하게 순서가 매겨질 수 있다. 예컨대 S 및 E가 단편의 시작과 단부이고 a,b,c가 각 소단편에 속하는 상이한 서열이고 R1 및 R2가 직렬로 반복된 두 개의 k-1 서열인 포맷 S-R1-a-R2-b-R1-c-R2-E에서 5개의 소단편이 발생된다(S-R1, R1-a-R2, R2-b-R1, R1-C-R2, R-E). 이들은 두가지 방식으로 순서가 정해진다: 원래 서열이나 S-R1-c-R2-b-R1-a-R2-E 대조적으로 동일한 수 및 종류의 반복된 서열을 가지지만 상이하게 순서가 정해진 단편에서, 즉 S-R1-a-R1-b-R2-c-R2-E에서 모든 소단편을 포함하는 다른 서열은 없다. 이러한 종류는 단지 pSF 발생공정후에만 인식될 수 있다. 이들은 pSF 발생 공정에서 두 단계 필요성을 나타낸다. 파일이 잘못된 음 또는 양의 k-집합을 포함할 때 반복안된 k-1 서열의 위치상에 잘못된 짧은 소단편의 발생 상황이 더 중요하다.The purpose of this algorithm is to reduce the number of pSFs to the smallest minimum number of shorter sequences. The generation of longer small fragments or complete sequences is possible in two situations. The first situation relates to the specific order of repeated k-1 words. Some or all of the maximum extended pSFs (first group) may be uniquely ordered. For example, format S-R1-a-R2-b, where S and E are the beginning and end of the fragment, a, b, c are different sequences belonging to each subfragment, and R1 and R2 are two k-1 sequences repeated in series Five small fragments occur at -R1-c-R2-E (S-R1, R1-a-R2, R2-b-R1, R1-C-R2, RE). They are ordered in two ways: in the original sequence or in S-R1-c-R2-b-R1-a-R2-E contrasting fragments having the same number and type of repeated sequences, but differently ordered, That is, there is no other sequence that includes all of the small fragments in S-R1-a-R1-b-R2-c-R2-E. This kind can only be recognized after the pSF generation process. These indicate a two step need in the pSF generation process. When the file contains an incorrect negative or positive k-set, the situation of occurrence of a false short fragment on the position of the unrepeated k-1 sequence is more important.
두 pSF 그룹에 대한 방법은 두가지 부분으로 구성된다. 첫째, 비존재 최소 소단편으로 나타나는 잘못된 양의 k-집합이 제거된다. 한 단부에서 k-a보다 길며 다른 단부에서 k-b보다 긴 길이의 어느 한 단부상에 중첩이 되지 않은 길이 k의 모든 k-집합 소단편은 제거되어서 최대한의 연결을 형성시킬 수 있다. 실험에서 2 및 3 의 a 및 b의 값이 충분한 수의 잘못된 양의 k-집합 제거에 적합한 것으로 여겨졌다.The method for two pSF groups consists of two parts. First, erroneous amounts of k-sets that appear as non-existent minimal fragments are eliminated. All k-set small fragments of length k not overlapping on either end longer than k-a at one end and longer than k-b at the other end can be removed to form the maximum connection. In experiments the values of a and b of 2 and 3 were considered suitable for removing a sufficient number of incorrect amounts of k-sets.
고유하게 연결될 수 있는 소단편의 통합이 제 2 단계에서 수행된다. 연결 규칙은 다음과 같다: 두 개의 소단편의 시작부 또는 관련 단부에서 중첩 서열이 다른 소단편의 시작부 또는 단부에서 존재하지 않은 경우에만 두 개의 소단편은 명백히 연결될 수 있다.The integration of small fragments which can be uniquely connected is carried out in the second step. The linking rules are as follows: Two small fragments can be explicitly linked only if there is no overlapping sequence at the beginning or end of the two small fragments at the beginning or end of the other small fragment.
예외는 고려된 쌍의 한 소단편이 동일한 시작부 및 단부를 가질 경우이다. 이러한 경우에 동일한 단부가 파일에 존재하는 또다른 소단편이 있을 경우에도 연결이 허용된다. 문제점은 중첩 서열의 올바른 정의이다. 단지 한 쌍의 소단편에 대해서 고유한 중첩 서열이 k-2보다 짧거나 k-2 또는 그보다 더 길지만 k-4보다 긴 길이의 중첩 서열을 갖는 추가 소단편이 존재할 경우에 연결은 허용되지 않는다. 또한 하나 또는 적은 수의 마지막 염기를 생략한 후의 단부와 pSF의 정규 단부가 중첩 서열로 간주된다.The exception is when one small piece of the considered pair has the same start and end. In this case the connection is permitted even if there is another small piece with the same end present in the pile. The problem is the correct definition of overlapping sequences. For only a pair of small fragments the linkage is not allowed if there is an additional small fragment with an overlapping sequence of length less than k-2 or longer than k-2 or longer, but longer than k-4. Also the end after omitting one or a small number of the last bases and the normal end of the pSF are considered overlapping sequences.
이 단계후 잘못된 단부를 갖는 일부 소단편과 잘못된 양의 k-집합(최소 소단편으로서)이 생존할 수 있다. 추가로, 특정수의 잘못된 특정 k-집합이 동시에 존재하는 매우 드문 경우에 오류 연결이 일어날 수 있다. 이러한 경우는 탐지되어서 소단편 순서지정공정에서 그리고 절단안된 "잘못 연결된" 소단편을 취급하는 추가 제어단계에서 해결된다.After this step some small fragments with wrong ends and wrong amounts of k-sets (as the smallest minor fragments) can survive. In addition, an error concatenation can occur in very rare cases where a certain number of erroneous specific k-sets exist simultaneously. This case is detected and resolved in the small fragment sequencing process and in an additional control step for handling uncut "misconnected" small fragments.
수득된 짧은 소단편은 두 종류이다. 공통적인 경우에 이들 소단편은 반복된 k-1 서열의 분포 때문에 명백히 연결될 수 있다. 이것은 pSF 발생공정후에 행해지며 pSF 발생공정에서 두 단계 필요성의 양호한 실례이다. 잘못된 양 또는 음의 k-집합을 포함하는 파일을 사용할 경우에 반복안된 k-1 서열의 사이트상에 짧은 pSF가 수득된다. 잘못된 양의 k-집합의 경우에 k-집합은 하나 이상의 잘못된 염기를 포함할 수 있고(또는, 중앙에 하나의 잘못된 염기를 포함하고) 단부상의 k-집합도 마찬가지이다. 짧고 잘못 연결된 소단편의 발생은 후자의 k-집합에 의해 야기된다. 전자의 k-집합은 k-집합 길이와 동일한 길이를 가진 잘못된 pSF를 나타낸다.The short small fragments obtained are of two types. In common cases these small fragments may be explicitly linked due to the distribution of repeated k-1 sequences. This is done after the pSF generation process and is a good example of the need for two steps in the pSF generation process. Short pSF is obtained on the site of an unrepeated k-1 sequence when using a file containing an incorrect positive or negative k-set. In the case of an incorrect amount of k-set, the k-set may contain one or more wrong bases (or one wrong base in the middle) and so on. The occurrence of short, misconnected small fragments is caused by the latter k-set. The former k-set represents the wrong pSF with the same length as the k-set length.
pSF 통합 목적은 pSF의 수를 최소갯수의 올바른 서열을 갖는 더 긴 소단편으로 감소시키는 것이다. 한 단부에서 k-a보다 길고 다른 단부에서 k-b보다 긴 길이를 가지며 어느 한 단부에서도 중첩되지 않은 모든 k-집합 소단편은 제거되어서 최대한의 연결을 가능하게 한다. 이러한 방식으로 대부분의 잘못된 양의 k-집합이 폐기된다. 연결 규칙은 다음과 같다: 두 개의 소단편의 시작부 또는 단부의 중첩 서열이 다른 소단편의 시작부 또는 단부에 존재하지 않을 경우에만 두 개의 소단편이 연결될 수 있다. 예외는 동일한 시작부 및 단부를 갖는 소단편이다. 이 경우에 파일에 동일한 단부를 갖는 또다른 소단편이 있을 경우에만 연결이 허용된다. 문제는 중첩 서열의 정확한 정의이다. k-1 또는 k-2 서열의 반복점상에 적어도 두 개의 잘못된 음의 k-집합의 존재와 잘못된 양 및 음의 k-집합 조합은 일부 중첩 서열을 파괴 또는 "차단"하고 명백하지만 잘못된 pSF 연결을 제공할 수 있다. 이를 방지하기 위해서 정확성을 위해서 완전성이 희생되어야 한다: k-2보다 짧은 단부-서열과 k-2보다 긴 추가 중첩 서열의 존재시 연결이 허용되지 않는다. 중첩 서열이 pSF 단부로 부터 한정되거나 하나 또는 수개의 마지막 염기를 생략한다.The purpose of pSF integration is to reduce the number of pSFs into longer, smaller fragments with the least number of correct sequences. All k-set small fragments that are longer than k-a at one end and longer than k-b at the other end and not overlapping at either end are removed to allow for maximum connection. In this way most wrong amounts of k-sets are discarded. The linking rule is as follows: Two small fragments may be linked only if there is no overlapping sequence at the beginning or end of the two small fragments at the beginning or end of the other small fragment. The exception is small fragments with the same start and end. In this case the connection is only permitted if there is another small piece with the same end in the pile. The problem is the precise definition of overlapping sequences. The presence of at least two false negative k-sets and the wrong positive and negative k-set combinations on the repeat points of the k-1 or k-2 sequences destroy or "block" some overlapping sequences and result in obvious but incorrect pSF linkages. Can provide. To prevent this, integrity must be sacrificed for accuracy: linkage is not allowed in the presence of end-sequences shorter than k-2 and additional overlapping sequences longer than k-2. The overlapping sequence is defined from the pSF end or omits one or several last bases.
특정수의 잘못된 양 및 음의 k-집합이 존재하는 매우 드문 상황에서 잘못된 단부를 갖는 일부 소단편이 생존할 수 있고 일부 잘못된 양의 k-집합(최소의 소단편으로)이 남을 수 있고 잘못된 연결이 일어날 수 있다. 이러한 경우는 탐지되어서 소단편 순서지정 공정과 절단안된 잘못 연결된 소단편 취급을 하는 추가 제어 공정에서 해결된다.In very rare situations where there is a certain number of incorrect positive and negative k-sets, some small fragments with wrong ends may survive, and some incorrect positive k-sets (with the smallest minor fragments) may be left and the wrong connections This can happen. This case is detected and resolved in an additional control process that handles small fragment sequencing and unconnected small fragments that are not cut.
소단편 순서지정공정은 발생공정과 유사하다. 소단편이 더 긴 k-집합일 경우에 중첩 단부를 통한 명백한 연결에 의해 순서가 정해진다. 명백한 연결을 위한 정보는 기본 라이브러리에 있는 단편에 발생된 소단편을 단편의 세그멘트를 나타내는 그룹으로 분할된다. 이 방법은 관련 연결서열을 갖는 더 긴 올리고누클레오티드와의 교잡에 기초한 문제의 생화학적 해결방법과 유사하다. 연결 서열은 기본 라이브러리 단편의 적절한 세그멘트로된 k-집합을 사용하여 소단편으로서 발생된다. 관련 세그멘트는 기본 라이브러리의 각 단편과 중첩하는 순서지정 라이브러리의 단편에 의해 한정된다. 가장 짧은 세그멘트는 순서지정 라이브러리의 정보 단편이다. 더 긴 것은 여러개의 이웃하는 정보 단편이거나 순서지정 및 기본 라이브러리의 단편의 총 중첩 부위이다. 분리된 샘플의 수를 감소시키기 위해서 순서지정 라이브러리의 단편이 무작위로 모아지고 고유한 k-집합 내용이 결정된다.The small fragment sequencing process is similar to the generation process. If the small fragments are longer k-sets, they are ordered by explicit connection through the overlapping ends. Information for explicit linkage is divided into small fragments generated in fragments in the base library into groups representing fragment segments. This method is similar to the biochemical solution of the problem based on hybridization with longer oligonucleotides with related linkage sequences. The linking sequence is generated as a small fragment using a k-set of appropriate segments of the base library fragment. Associated segments are defined by fragments of the ordered library that overlap each fragment of the base library. The shortest segment is the information fragment of the ordered library. Longer is the number of neighboring pieces of information or the total overlap of fragments of the ordering and base libraries. To reduce the number of separated samples, fragments of the ordered library are randomly collected and unique k-set contents are determined.
순서지정 라이브러리에 있는 많은 수의 단편을 사용하여 매우 짧은 세그멘트가 발생되어서 소단편 발생의 이유인 k-1 서열의 다중 발생 가능성을 감소시킨다. 게다가, 기본 라이브러리의 단편의 다양한 지역으로 구성된 더 긴 세그멘트는 반복된 k-1 서열의 일부를 포함하지 않는다. 모든 세그멘트에서 연결서열(연결 소단편)이 주어진 단편으로 부터 특정 소단편을 위해 발생된다. 순서지정 공정은 세단계로 구성된다: (1) 각 세그멘트의 k-집합 내용 발생; (2) 각 세그멘트에 소단편 발생; (3) 세그멘트의 소단편 연결. 제 1 세그멘트는 기본 라이브러리의 단편의 k-집합 내용과 순서지정 라이브러리의 푸울의 k-집합 내용의 차이 및 중첩으로서 정의된다. 제 2 (더 짧은) 세그멘트는 제 1 세그멘트의 k-집합 내용의 차이 및 중첩으로서 정의된다.A large number of fragments in the sequencing library can be used to generate very short segments, reducing the likelihood of multiple occurrences of the k-1 sequence, which is the reason for small fragment generation. In addition, longer segments consisting of various regions of fragments of the base library do not include portions of the repeated k-1 sequence. In every segment, a linking sequence (linking small fragment) is generated for a particular small fragment from a given fragment. The ordering process consists of three steps: (1) generating the k-set contents of each segment; (2) small fragments in each segment; (3) Small piece connection of segment. The first segment is defined as the difference and overlap between the k-set contents of the fragments of the base library and the k-set contents of the pool of the ordered library. The second (shorter) segment is defined as the difference and overlap of the k-set contents of the first segment.
차이 및 중첩에 있어서 잘못된 양 및 음의 k-집합을 축적하는 문제가 있다. 출발서열로 부터 나오는 잘못된 음의 k-집합은 중첩부에서 축적되고 잘못된 양의 k-집합이 두 서열에서 무작위로 발생되지만 중첩 지역에서는 그렇지 않다. 다른 한편으로는 출발 서열에서 나오는 잘못된 양의 k-집합의 대부분은 중첩부에 취해지지 않는다. 이것은 중첩하는 단편에서 나오는 정보를 사용하여 단편의 실험 에러를 감소시키는 일례이다. 잘못된 k-집합은 또다른 이유로 차이로 축적된다. 최초 서열에서 나오는 잘못된 음의 k-집합은 에러에 의해 중첩부에 포함되지 않은 잘못된 양의 k-집합을 위해 확장된다. 만약 출발서열이 10%의 잘못된 음의 데이터를 포함하면 제 1 및 제 2 중첩은 각각 19% 및 28%의 잘못된 음이 k-집합을 포함한다. 다른 한편으로는 77개의 잘못된 양의 k-집합에 대한 수학적 기대치는 기본 단편과 푸울이 각각 500bp 및 10,000bp의 길이를 가진다면 예측될 수 있다. 그러나, "손실된" k-집합의 대개를 회수하고 잘못된 양의 k-집합을 제거할 방법이 있다.There is a problem of accumulating wrong positive and negative k-sets in difference and overlap. False negative k-sets from the starting sequence accumulate at the overlap and false positive k-sets occur randomly in the two sequences, but not at the overlap regions. On the other hand, most of the wrong amounts of k-sets from the starting sequence are not taken at overlap. This is an example of using the information from the overlapping fragments to reduce the experimental error of the fragments. Incorrect k-sets accumulate as differences for another reason. False negative k-sets from the original sequence are expanded for false positive k-sets that are not included in the overlap by error. If the starting sequence contains 10% false negative data, then the first and second overlaps contain 19% and 28% false negative k-sets, respectively. On the other hand, mathematical expectations for 77 incorrect amounts of k-sets can be predicted if the base fragment and the pool are 500bp and 10,000bp in length, respectively. However, there are ways to recover most of the "lost" k-sets and to remove the wrong amount of k-sets.
첫째 주어진 쌍의 k-집합 내용의 중첩으로서 주어진 세그멘트에 대한 k-집합의 기본 내용을 결정해야 한다. 이후에 중첩에 출발 k-집합 내용의 모든 k-집합을 포함시키며, 이것은 기본 집합의 두 개의 k-집합의 단부중 한 단부에서 k-1 서열은 다른 단부에서 k-+ 서열을 포함한다. 이것은 차이 발생전에 행해져서 이 공정에서 잘못된 양의 k-집합 확장이 차이에 적용된다. 모든 임대된 k-집합은 잘못된 양의 k-집합으로서 중첩 파일에서 제거된다.First, we need to determine the base content of the k-set for a given segment as the overlap of the contents of the k-set of a given pair. The overlap then includes all k-sets of the starting k-set content, where the k-1 sequence at one end of the two k-sets of the base set includes the k- + sequence at the other end. This is done before the difference occurs so that the wrong amount of k-set expansion is applied to the difference in this process. All leased k-sets are removed from the nested file as an incorrect amount of k-sets.
공통 k-집합인 중첩부가 각 쌍(기본 단편)에 대해 X (순서지정 라이브러리 푸울)로 정의된다. 만약 k-집합의 수가 많으면 기술된 규칙에 따라 잘못된 네가티브로 확장된다. 제 1 차이 세트가 주어진 기본 단편으로 부터 수득된 중첩 세트를 뺌으로써 수득된다. 잘못된 네가티브 k-집합이 중첩 세트에서 나온 차이 세트에 부착되고 잘못된 포지티브 k-집합으로서 중첩 세트로 부터 제거된다. 기본 단편이 모아진 단편보다 길 때 이 차이는 추가 단계에서 활용성을 약간 감소시킨 두 개의 분리된 세그멘트를 나타낼 수 있다. 제 1 세그멘트는 상당수의 k-집합을 포함하는 쌍(기본 단편) X (순서지정 라이브러리)의 발생된 중첩 및 차이이다. 제 2 세그멘트의 k-집합이 제 1 세그멘트의 모든 가능한 쌍의 k-집합을 비교함으로써 수득된다. 상당수의 k-집합을 가지고 중첩을 생성하는 각 쌍으로 부터 두 개의 차이가 한정된다. 중첩된 단편으로 부터 이용가능한 정보의 대부분은 이 단계에서 회복되어서 중첩 및 차이를 형성하는 제 3 라운드로 부터 수득될 것이 거의 없다.The overlap, which is a common k-set, is defined as X (ordered library pool) for each pair (base fragment). If the number of k-sets is large, they are expanded incorrectly according to the rules described. The first difference set is obtained by subtracting the overlap set obtained from a given base fragment. The wrong negative k-set is attached to the difference set from the nested set and removed from the nested set as the wrong positive k-set. When the base fragment is longer than the collected fragments, this difference can represent two separate segments that slightly reduced usability in an additional step. The first segment is the generated overlap and difference of the pair (base fragment) X (ordering library) containing a significant number of k-sets. The k-set of the second segment is obtained by comparing the k-sets of all possible pairs of the first segment. Two differences are defined from each pair, with a large number of k-sets creating overlap. Most of the information available from the overlapping fragments is rarely obtained from the third round, which is recovered at this stage to form overlaps and differences.
(2) 세그멘트의 소단편 발생이 기본 라이브러리의 단편에 대해 기술된대로 수행된다.(2) Small fragment generation of segments is performed as described for fragments of the base library.
(3) 소단편 연결방법은 일부 중첩된 단부를 가지는 기본 라이브러리 단편으로부터 나오는 소단편중에서 올바르게 연결된 소단편 쌍을 순차적으로 결정하는 단계를 포함한다. 4개의 관련 소단편의 경우에 두 개는 동일한 시작부를 가지고 두 개는 동일한 단부를 가지므로 연결될 수 있는 4개의 상이한 소단편쌍이 있다. 일반적으로 두 개는 올바르고 2개는 잘못되었다. 올바른 것을 발견하기 위해서 각쌍의 연결 서열의 존재가 주어진 기본 단편에 대한 모든 제 1 및 제 2 세그멘트로 부터 발생된 소단편에서 테스트된다. 연결서열의 길이 및 위치는 우연히 발생하는 서열과의 간섭을 피하도록 선택된다. 이들은 k+2 이상의 길이이며 주어진 쌍의 소단편에서 중첩 서열 뿐만 아니라 적어도 하나의 요소 2를 포함한다. 단지 두 개의 연결서열이 발견되고 나머지 두 개는 존재하지 않으면 연결이 허용된다. 두 개의 연결된 소단편은 파일에 있는 이전 소단편을 대체하고 이 과정이 주기적으로 반복된다.(3) The small fragment linking method includes sequentially determining a pair of small fragments that are correctly connected among the small fragments coming from the basic library fragment having some overlapping ends. In the case of four related small fragments, there are four different small fragment pairs that can be connected because two have the same beginning and two have the same end. Generally two are correct and two are wrong. To find the correct one, the presence of each pair of linking sequences is tested in small fragments resulting from all the first and second segments for a given base fragment. The length and position of the linking sequences are chosen to avoid interference with sequences that occur by chance. They are at least k + 2 in length and comprise at least one element 2 as well as overlapping sequences in a given fragment of small fragments. If only two connection sequences are found and the other two do not exist, the connection is allowed. The two linked small fragments replace the previous small fragment in the file and the process is repeated periodically.
이 단계에서 반복된 서열이 발생된다. 이것은 일부 소단편이 한번 이상 연결된 소단편에 포함됨을 의미한다. 이들은 두 개의 상이한 소단편과 한 소단편을 연결시키는 연결서열을 발견함으로써 식별된다.Repeated sequences are generated at this stage. This means that some small fragments are included in the linked small fragments more than once. These are identified by finding the linking sequence connecting two different small fragments with one small fragment.
pSF 구축 및 pSF를 더 긴 소단편으로 통합하는 과정에서 발생된 잘못 연결된 소단편의 인식은 기본 단편에서 나오는 소단편의 서열이 이 단편에 대해 세그멘트에서 발생된 소단편의 서열에 존재하는지 여부 테스트에 기초한다. 부정확하게 연결된 위치의 서열은 발견되지 않으므로 잘못 연결된 소단편임을 표시한다.Recognition of mislinked small fragments resulting from pSF construction and incorporation of pSF into longer fragments is a test of whether the sequence of small fragments from the base fragment is present in the sequence of small fragments generated in the segment for this fragment. Based. The sequence at the incorrectly linked position is not found, indicating that it is a poorly linked small fragment.
앞서 기술된 세단계 뿐만 아니라 소단편 순서지정에 있어서 특정 서열에 적용가능한 추가 조절 단계가 실수없이 더 완벽한 서열 발생을 위해 필요하다.In addition to the three steps described above, additional control steps applicable to specific sequences in small fragment sequencing are necessary for more complete sequence generation without mistakes.
소단편이 어느 세그멘트에 속하는지의 결정은 세그멘트 및 소단편에서 k-집합의 내용을 비교하여 수행된다. 푸울의 제 1 에러와 k-집합 발생 빈도의 통계적 에러로 인한 k-집합 내용의 에러 때문에 소단편의 정확한 구별은 불가능하다. 따라서 주어진 소단편에서 나올 확률(P(sf,s))이 각 소단편에 대해 측정된다. 이 확률은 k-집합 길이, 소단편 길이, 순서지정 라이브러리 단편의 길이, 푸울의 크기, 및 파일에서 잘못된 k-집합의 비율의 함수이다: P(sf,s)=(Ck-F)/LsfDetermination of which segment a small fragment belongs to is performed by comparing the contents of the k-set in the segment and the small fragment. Accurate distinction of small fragments is not possible due to errors in the k-set contents due to the first error of the pool and the statistical error of the frequency of k-set occurrences. Therefore, the probability P (sf, s) coming from a given small fragment is measured for each small fragment. This probability is a function of the k-set length, the small fragment length, the length of the ordered library fragment, the size of the pool, and the ratio of bad k-sets in the file: P (sf, s) = (Ck-F) / Lsf
여기서, Lsf는 소단편의 길이이고 Ck는 주어진 소단편/세그멘트 쌍에 대한 공통 k-집합의 수이고 F는 k-집합 길이, 기본 라이브러리 단편, 푸울 크기 및 에러비율간의 관계를 포함하는 매개 변수이다.Where Lsf is the length of the small fragments, Ck is the number of common k-sets for a given small fragment / segment pair, and F is a parameter containing the relationship between k-set length, base library fragment, pool size, and error rate .
특정 세그멘트에 기여하는 소단편은 과다한 짧은 pSF로서 취급되고 명백한 연결 공정을 받는다. 명백한 연결의 정의는 이 경우에 약간 다른데, 그 이유는 중첩 단부를 갖는 소단편이 고려된 세그멘트에 속할 가능성에 기초하기 때문이다. 게다가, 명백한 연결의 정확도는 이들 소단편의 다른 세그멘트에 연결에 의해 조절된다. 상이한 세그멘트에서 연결후 수득된 모든 소단편은 합쳐지고 더 긴 소단편내에 포함된 짧은 소단편이 제거되고 나머지는 통상의 연결과정을 받는다. 만약 서열이 완전히 재발생되지 않으면 특정 세그멘트에 속할 덜 엄격한 확률 기준을 써서 분리 및 소단편 연결 과정이 반복되고 명백한 연결이 수행된다.Small fragments contributing to a particular segment are treated as excessive short pSFs and undergo an explicit linking process. The definition of the apparent connection is slightly different in this case, since the small fragments with overlapping ends are based on the possibility that they belong to the segment considered. In addition, the accuracy of the apparent connection is controlled by connecting to other segments of these small fragments. All small fragments obtained after linking in different segments are combined and the short small fragments contained in the longer small fragments are removed and the remainder is subjected to conventional linking procedures. If the sequence is not completely reoccurring, the separation and small fragment ligation process is repeated and an explicit ligation is carried out using less stringent probability criteria belonging to the particular segment.
명백한 중첩을 정의하는 엄격한 기준을 사용할 때 어떤 정보는 사용되지 않는다. 완전한 서열 대신에 주어진 단편에 대해 몇 개의 소단편이 수득된다. 덜 엄격한 기준을 사용하여 정확하고 완전한 서열이 발생된다. 어떤 상황에서 (예, 오류가 있는 연결시) 완전하지만 부정확한 서열을 발생하거나 연결이 없는 "괴물" 소단편은 발생할 수 있다. 따라서 기본 라이브러리의 각 단편에 대해서 하나가 올바른 몇가지 가능한 해결책과 가장 가능성 있는 올바른 해답을 수득한다. 또한 드문 경우에 소단편 발생 공정의 실수나 소속 확률의 특정 비율로 인하여 명백한 해답이 발생되지 않는다. 이 경우는 불완전한 서열로 유지되거나 기본 라이브러리의 다른 중첩된 단편의 데이타와 비교하여 명백한 해답이 얻어진다.No information is used when using strict criteria that define explicit overlap. Several small fragments are obtained for a given fragment instead of the complete sequence. Less stringent criteria are used to generate accurate and complete sequences. In some situations (eg, with erroneous linkages), a complete but incorrect sequence may occur or a "monster" small fragment with no linkages may occur. Thus, for each fragment of the base library, one gets some possible solutions and the most likely correct solution. Also, in rare cases, errors in the small fragment generation process or a certain percentage of the probability of belonging do not produce clear answers. In this case an obvious solution is obtained by keeping the incomplete sequence or comparing the data of other nested fragments of the base library.
기술된 알고리즘이 인간 게놈의 GC 함량을 모방하는 40% GC를 함유하며 무작위로 발생된 50kb 서열에 대해 테스트 되었다. 이 서열의 중앙부분에 총 길이가 4kb 정도인 다양한 All과 반복 서열이 삽입되었다. 생체밖 SBH 실험을 위해서 다음 공정이 수행되어 적절한 데이타가 수득된다.The algorithm described was tested against randomly generated 50 kb sequences containing 40% GC mimicking the GC content of the human genome. In the center of the sequence, various All and repeat sequences of about 4 kb in total were inserted. For ex vivo SBH experiments the following process is carried out to obtain appropriate data.
- 60개의 5kb 중첩 "클론"의 위치가 무작위로 정의되어서 기본 라이브러리 제조를 모방한다:The positions of 60 5kb overlapping "clones" are randomly defined to mimic basic library preparation:
- 1000개의 500bp "클론"의 위치가 무작위로 결정되어서 순서지정 라이브러리 제조를 모방한다. 이들 단편은 서열에서 추출한다. 20단편의 랜덤 푸울이 형성되고 푸울의 k-집합이 결정되고 하드 디스크에 저장된다. 이들 데이타는 소단편 순서지정단계에서 사용된다: 동일 밀도의 클론의 경우에 기본 라이브러리에서 4백만 클론과 순서지정 라이브러리에서 3백만 클론이 전체 인간 게놈을 위해 사용된다. 총 7백만 클론은 모든 게놈 DNA 클로닝과 겔-기초 방법에 의한 서열화를 위한 수 kb 길이의 클론보다 몇배 적다.The locations of 1000 500 bp “clones” are randomly determined to mimic the ordered library preparation. These fragments are extracted from the sequence. Twenty fragments of random pools are formed and the k-sets of the pools are determined and stored on the hard disk. These data are used in the small fragment sequencing step: for clones of equal density, 4 million clones in the base library and 3 million clones in the sequence library are used for the entire human genome. A total of 7 million clones are several times less than a few kb long clones for all genomic DNA cloning and sequencing by gel-based methods.
5kb 단편의 시작과 끝의 데이타로 부터 117 "정보단편"이 서열에 있는 것으로 결정된다. 이후에 단일 "정보" 단편이 존재하는 중첩 k-집합의 결정이 이어진다. 예정된 리스트에 일치하는 k-집합 부분 집합만이 사용된다. 리스트는 65% 8-mer, 30% 9-mer, 5% 10-12-mer를 포함한다. 소단편의 발생 및 순서지정공정이 이들 데이타에 기초하여 수행되었다.From the data at the beginning and end of the 5 kb fragment, 117 "information fragments" are determined to be in sequence. This is followed by the determination of the overlap k-sets in which a single "information" fragment exists. Only k-set subsets matching the intended list are used. The list includes 65% 8-mer, 30% 9-mer, 5% 10-12-mer. Small fragment generation and sequencing processes were performed based on these data.
두가지 실험에서 나온 데이타에 대해 알고리즘 테스트가 수행된다. 50개의 정보 단편의 서열이 100% 올바른 데이타 세트(20,000bp 이상)로 재발생되고 26개의 정보 단편(10,000bp)이 10% 잘못된 k-집합(5% 포지티브, 5% 네가티브)으로 재발생되었다.Algorithm tests are performed on the data from the two experiments. The sequence of 50 information fragments was regenerated with a 100% correct data set (20,000 bp or more) and 26 information fragments (10,000 bp) were regenerated with 10% incorrect k-sets (5% positive, 5% negative).
첫 번째 실험에서 모든 소단편은 정확하고 50개의 정보 단편중 하나에서 서열이 완전 재발생되지 않고 5개의 소단편 형태로 남아있다. 순서지정 라이브러리의 중첩된 단편의 위치 분석은 이들이 5 소단편의 고유한 순서지정에 대한 정보가 부족함을 보여준다. 소단편은 중첩 단부에 기초하여 두가지 방식, 1-2-3-4-5 및 1-4-3-2-5으로 연결될 수 있다. 유일한 차이는 소단편 2와 4의 위치 교환이다. 소단편 2,3,4는 비교적 짧기 때문에 (총 100bp) 순서지정 라이브러리 단편중 어느것도 소단편 3에서 시작되거나 끝나지 않을 것이다.In the first experiment, all the small fragments are accurate and the sequence in one of the 50 information fragments does not completely regenerate and remains in the form of five small fragments. Positional analysis of nested fragments in the ordering library shows that they lack information about the unique ordering of the five subfractions. The small fragments can be joined in two ways, 1-2-3-4-5 and 1-4-3-2-5, based on the overlapping ends. The only difference is the positional exchange of subsections 2 and 4. Since subfractions 2, 3, and 4 are relatively short (total 100bp), none of the ordered library fragments will begin or end in subfragment 3.
실제 서열화 공정을 시뮬레이션 하기 위해서 몇 개의 잘못된 ("교잡") 데이타가 수많은 실험에서 입력으로서 포함된다. 올리고머 교잡 실험에서 제안된 조건하에서 신뢰성 없는 데이타를 생성하는 유일한 상황은 완전 일치 교잡에 대한 단부 불일치이다. 그러므로, 시뮬레이션에서 한 단부상의 단일 요소에서 차이가 나는 k-집합만이 잘못된 포지티브인 것으로 간주되었다. "잘못된" 세트가 다음과 같이 형성된다. 정보 단편의 최초 k-집합상에 5% 잘못된 포지티브 k-집합의 부분집합이 첨가된다. 잘못된 포지티브 k-집합은 k-집합을 임의로 뽑아서 복제하고 시작 또는 단부상의 뉴클레오티드를 변경함으로써 형성된다. 이어서 5% 임의 선택된 k-집합의 뺄셈이 수행된다. 이러한 방식으로 올바른 k-집합이 단부상에 잘못된 베이스를 갖는 k-집합으로 교체되는 가장 복잡한 경우가 발생된다.In order to simulate the actual sequencing process, some incorrect ("crossover") data is included as input in many experiments. The only situation that produces unreliable data under the conditions proposed in oligomeric hybridization experiments is the end mismatch for exact match hybridization. Therefore, only k-sets that differ in a single element on one end in the simulation were considered to be false positives. The "wrong" set is formed as follows. A subset of 5% false positive k-sets is added to the first k-sets of information fragments. A false positive k-set is formed by randomly copying the k-set to replicate and altering the nucleotides on the start or end. Subtraction of the 5% randomly selected k-sets is then performed. In this way the most complex case arises where the correct k-set is replaced with a k-set with the wrong base on the end.
k-집합 발생은 최대 10% 잘못된 데이타를 가져온다. 이 값은 복제, 변경 및 삭제될 k-집합 선택의 임의성 때문에 경우마다 다르다. 그럼에도 불구하고 이 비율은 실제 교잡 실험에서 신뢰성없는 데이타의 양보다 3-4배 초과한다. 10%의 도입된 에러는 기본 라이브러리 단편(기본 라이브러리 정보단편) 및 세그멘트에서 소단편의 수를 두배 증가시킨다. 최종 소단편중 약 10%는 잘못된 포지티브를 포함하는 k-집합에서 기대되는 바와 같이 단부에 잘못된 염기를 가진다. 소단편 잘못연결의 경우나 잘못된 서열을 갖는 소단편도 관찰되지 않는다. 순서지정 공정에서 실험된 26개중 4개의 정보단편에서 완전한 서열이 재발생되지 않는다. 모두 4가지 경우에서 동일 세그멘트에 포함된 수개의 더 긴 소단편과 더 짧은 소단편 형태로 서열이 수득된다. 이 결과는 알고리즘 원리가 큰 비율의 잘못된 데이타의 경우에도 작용한다는 것을 보여준다.k-set occurrences result in up to 10% incorrect data. This value varies from case to case because of the randomness of the k-set selection to be replicated, changed and deleted. Nevertheless, this ratio exceeds 3-4 times the amount of unreliable data in actual hybridization experiments. The introduced error of 10% doubles the number of small fragments in the basic library fragment (basic library information fragment) and segments. About 10% of the final small fragments have the wrong base at the end as expected in the k-set containing the wrong positive. Neither small fragment mislinking nor small fragments with incorrect sequences are observed. Complete sequences do not regenerate in four of the 26 information fragments tested in the sequencing process. In all four cases, sequences are obtained in the form of several longer and shorter fragments contained in the same segment. The results show that the algorithmic principle works for a large proportion of incorrect data.
k-집합 내용으로 부터 서열발생의 성공이 완전성 및 정확도 측면에서 기술될 수 있다. 발생공정에서 두가지 특수 상황이 한정될 수 있다: 1) 정보의 일부는 발생된 서열에 빠지지만 모호한 위치 및 타입을 알 수 있는 상황; 2) 재발생된 서열이 k-집합 내용이 발생된 서열과 일치하지 않지만 실수가 탐지될 수 없는 상황. 정확한 k-집합의 사용에서 처럼 알고리즘이 이론적 한계까지 개발되었다고 가정하면 첫 번째 상황이 일어날 수 있다. 불완전성은 명백하게 순서가 지정될 수 없는 특정수의 소단편과 단조 서열의 정확한 길이(완전한 직렬 반복의 수) 결정 문제를 가져온다.The success of sequencing from the k-set content can be described in terms of completeness and accuracy. Two special situations can be defined in the development process: 1) a part of the information falls into the generated sequence but the vague location and type is known; 2) The situation in which the regenerated sequence does not match the sequence in which the k-set contents occurred, but no mistakes can be detected. Assuming the algorithm has been developed to theoretical limits, as in the use of the correct k-set, the first situation can occur. Incompleteness results in a problem of determining the exact length (number of complete series repetitions) of a certain number of small fragments and forging sequences that cannot be explicitly ordered.
잘못된 k-집합을 써서 틀린 서열이 발생될 수 있다. 오류의 원인은 알고리즘의 결함이 아니라 k-집합의 내용이 최초의 것과 상이한 서열을 명백히 나타낸다는 사실에 있다. 파일에 존재하는 잘못된 k-집합의 종류에 따라 세가지 부류의 에러가 있다. 잘못된 네가티브 k-집합(잘못된 포지티브를 수반하지 않은)은 "삭제"를 생성한다. 잘못된 네가티브를 수반하는 잘못된 포지티브는 "삽입" 또는 "삭제"를 발생한다. 삭제는 소단편의 두가지 시작부가 잘못된 네가티브일 때 발생된다. 서열의 모든 위치는 k-집합에 의해 한정되므로 삭제의 발생은 k 연속 잘못된 네가티브를 필요로 한다(10%의 잘못된 네가티브와 k=8인 상황은 108 요소후 발생한다). 이러한 상황은 10개의 게놈 등가물을 함유한 랜덤 라이브러리를 사용하여 포유동물 게놈 서열화 작업시 자주 발생하지 않는다.Incorrect sequences can be generated using incorrect k-sets. The cause of the error is not a flaw in the algorithm but the fact that the content of the k-set clearly represents a sequence that differs from the original. There are three classes of errors depending on the type of invalid k-sets present in the file. Bad negative k-sets (without bad positives) produce "delete". False positives followed by false negatives result in "insert" or "delete". Deletion occurs when the two beginnings of a small fragment are false negatives. Since all positions in the sequence are defined by the k-set, the occurrence of deletion requires k consecutive false negatives (10% false negatives and a situation where k = 8 occurs after 108 elements). This situation rarely occurs in mammalian genome sequencing operations using a random library containing ten genomic equivalents.
잘못된 포지티브 k-집합에 의해 야기된 서열 단부의 신장은 서열단부가 잘못된 네가티브 k-집합의 무한 선형 배열로서 간주될 수 있으므로 특수한 "삽입" 경우이다. 하나의 k-집합보다 긴 소단편을 발생하는 일군의 잘못된 포지티브 k-집합을 고려할 수 있다. 이러한 상황은 순서지정 라이브러리의 랜덤 단편처럼 소단편이 중첩된 단편에서 발생된다면 탐지될 수 있다. 삽입 또는 삭제 대신 삽입이 잘못된 포지티브 및 네가티브 k-집합의 조합 결과로서 발생할 수 있다. 첫 번째 경우에 연속 잘못된 네가티브의 수는 k보다 적다. 두 경우는 몇 개의 중첩하는 잘못된 포지티브 k-집합을 필요로 한다. 삽입 및 삭제는 이론적인 가능성이다. 왜냐하면 잘못된 k-집합의 수와 특이성이 너무 크기 때문이다.Elongation of sequence ends caused by erroneous positive k-sets is a special "insertion" case since the sequence ends can be regarded as an infinite linear array of erroneous negative k-sets. Consider a group of false positive k-sets that produce small fragments longer than one k-set. This situation can be detected if small fragments occur in overlapping fragments, such as random fragments in an ordered library. Insertion instead of insertion or deletion can occur as a result of a combination of false positive and negative k-sets. In the first case, the number of consecutive negative negatives is less than k. Both cases require several overlapping false positive k-sets. Insertion and deletion are theoretical possibilities. Because the number and specificity of the wrong k-sets are too large.
최소수의 이론적 조건을 충족시키지 않는 다른 상황에서 k-집합 내용에서 잘못된 포지티브 또는 네가티브는 완전성이 낮은 서열을 발생한다.In other situations where the minimum number of theoretical conditions are not met, a false positive or negative in the k-set content results in a sequence of low integrity.
용액에서 서열이 알려진 담체-결합 프로브와 라벨링된 프로브에 샘플을 노출시킴으로써 SBH, 샘플 핵산이 서열화된다. 프로브 리가아제가 프로브와 샘플의 혼합물에 도입되어 담체가 샘플을 따라 교잡된 결합된 프로브와 라벨링된 프로브를 가질 때 리가아제의 작용에 의해 두 개의 프로브가 화학적으로 결합된다. 세척후 화학적으로 연결된 담체 결합 및 라벨링된 프로브가 라벨링된 프로브의 존재에 의해 탐지된다. 배열의 특정 위치에서 담체 결합 프로브의 종류와 라벨링된 프로브의 종류를 식별함으로써 샘플 서열의 일부가 3개의 기질 샘플을 갖는 포맷상의 배열에서 한 지점에 라벨의 존재에 의해 결정될 수 있다. 모든 리게이션 반응된 프로브쌍의 최대 중첩서열이 작동하지 않은 경우는 없다. 서열화될 샘플중 어느것도 핵산 단편이나 10개의 염기쌍("bp")의 올리고누클레오티드가 아니다. 샘플은 4 내지 천개의 염기를 가진다.SBH, sample nucleic acid is sequenced by exposing the sample to a labeled carrier with a carrier-binding probe of known sequence in solution. Probe ligase is introduced into the mixture of probes and samples such that the two probes are chemically bound by the action of ligase when the carrier has a hybridized and labeled probe hybridized along the sample. After washing, chemically linked carrier bonds and labeled probes are detected by the presence of labeled probes. By identifying the type of carrier binding probe and the type of labeled probe at a particular location in the arrangement, a portion of the sample sequence can be determined by the presence of the label at a point in the formatal arrangement with three substrate samples. There is no case where the maximum nested sequence of all ligated probe pairs is not working. None of the samples to be sequenced are nucleic acid fragments or 10 base pairs (“bp”) oligonucleotides. The sample has 4 to 1,000 bases.
프로브의 길이는 10개 염기 미만, 특히 4-9개의 염기를 갖는 단편이다. 이러한 방식으로 담체 결합 프로브 배열은 주어진 길이의 모든 올리고누클레오티드를 포함하거나 특정 테스트용 올리고누클레오티드를 포함한다. 주어진 길이의 모든 올리고누클레오티드가 사용될 때 중심 올리고누클레오티드의 수는 4N이다. 여기서 N은 프로브의 길이이다.The probe is a fragment having less than 10 bases, in particular 4-9 bases. In this manner, the carrier binding probe arrangement includes all oligonucleotides of a given length or includes specific test oligonucleotides. The number of central oligonucleotides is 4 N when all oligonucleotides of a given length are used. Where N is the length of the probe.
실시예 18: 서열화 칩 재사용Example 18: Sequencing Chip Reuse
서열화 공정에서 리게이션이 사용될 때 통상의 올리고누클레오티드 칩은 즉시 재사용될 수 없다. 본 발명자에 의해 이 문제가 다양한 방식으로 극복된다.Conventional oligonucleotide chips cannot be reused immediately when ligation is used in the sequencing process. This problem is overcome by the inventor in various ways.
제 2 프로브, 프로브 P로 리보누클레오티드를 사용하고, 이 프로브는 RNAse 처리에 의해 후속 제거될 수 있다. RNAse 처리는 단쇄 RNA 3을 피리미딘 잔기로 끌어당겨서 인접한 누클레오티드에 대한 인산염 결합을 깨는 엔도리보누클레아제로 RNAse A를 활용할 수 있다. 최종 생성물은 피리미딘 3 포스페이트와 말단 피리미딘 3 포스페이트를 갖는 올리고누클레오티드이다. RNAse A는 조효소 및 2가 양이온 부재하에서 작용한다.Ribonucleotides are used as the second probe, probe P, which can be subsequently removed by RNAse treatment. RNAse treatment may utilize RNAse A as an endoribonuclease that pulls short-chain RNA 3 to pyrimidine residues to break phosphate bonds to adjacent nucleotides. The final product is an oligonucleotide with pyrimidine 3 phosphate and terminal pyrimidine 3 phosphate. RNAse A acts in the absence of coenzymes and divalent cations.
RNAse를 활용하기 위해서 Sambrook(1989)에 의해 발표된대로 적절한 RNAse 함유 버퍼에 칩을 양성시킨다. 10 내지 60분간 37℃에서 8 ×8㎜ 또는 9 ×9㎜ 배열마다 30-50ul의 RNAse-함유 버퍼를 사용하는 것이 좋다. 이후에 교잡 버퍼로 세척한다.To utilize the RNAse, the chip is positively loaded into the appropriate RNAse containing buffer as published by Sambrook (1989). It is recommended to use 30-50 ul of RNAse-containing buffer for every 8 x 8 mm or 9 x 9 mm array at 37 ° C. for 10 to 60 minutes. Afterwards wash with hybridization buffer.
널리 사용할 수는 없지만 Craig(1989)에 의해 발표된대로 우라실 염기를 사용할 수도 있다. 재사용가능한 칩생성을 위해 리게이션 반응된 프로브 조합을 파괴하는 것은 DNA로 부터 우라실을 제거하는 대장균 수선 효소 우라실-DNA 글리코실아세를 써서 달성된다.Although not widely available, uracil bases may be used as published by Craig (1989). Destruction of ligation-reacted probe combinations for reusable chip generation is accomplished using E. coli repair enzyme uracil-DNA glycosylase, which removes uracil from DNA.
프로브간의 절단가능한 결합을 발생시키고 탐지후 결합을 절단할 수도 있다. 예컨대, 이것은 Shabarova(1991) 및 Dolinnaya(1998)에 의해 발표된 화학적 리게이션 반응에 의해 달성될 수 있다.It is also possible to generate cleavable bonds between probes and cleave the bonds after detection. For example, this can be achieved by chemical ligation reactions published by Shabarova (1991) and Dolinnaya (1998).
Shabarova(1991)은 축합제로서 브롬화 시아노겐을 사용한 올리고디옥시리보누클레오티드의 축합반응을 발표한다. 1단계 화학적 리게이션 반응에서 올리고누클레오티드가 97℃까지 가열되고 0℃까지 느리게 냉각된후 아세토니트릴에든 1ul 10mM BrCN이 첨가된다.Shabarova (1991) discloses the condensation reaction of oligodioxyribonucleotides using cyanogen bromide as a condensing agent. In a one-step chemical ligation reaction, the oligonucleotide is heated to 97 ° C. and slowly cooled to 0 ° C., followed by the addition of 1ul 10 mM BrCN to acetonitrile.
Dolinnaya(1988)은 DNA 이중나선에 포스포아미디에이트 및 피로포스페이트 누클레오티드간 결합을 포함시키는 방법을 보여준다. 그들은 커플링제로서 수용성 카보디이미드(CDI)를 사용하여 DNA의 당인산염 골격을 변성시키기 위해 화학적 리게이션 반응을 사용한다. 포스포아미드 결합의 선택적 절단은 5분간 95℃ 15% CH3COOH와 접촉시키는 과정을 포함한다. 피로인산염 결합의 선택적 절단은 피리딘-물(9:1) 혼합물과 증류된 (CF3CO)2O와 접촉시키는 과정을 포함한다.Dolinnaya (1988) shows how to incorporate phosphoamidiate and pyrophosphate nucleotide bonds into DNA double helices. They use a chemical ligation reaction to denature the glycophosphate backbone of DNA using water-soluble carbodiimide (CDI) as coupling agent. Selective cleavage of phosphoamide bonds involves contacting 95 ° C. 15% CH 3 COOH for 5 minutes. Selective cleavage of pyrophosphate bonds involves contacting the pyridine-water (9: 1) mixture with distilled (CF 3 CO) 2 O.
실시예 19: 진단 - 돌연변이 스코링 또는 전체 유전자 재서열화Example 19: Diagnosis-Mutant Scoring or Whole Gene Resequencing
간단한 경우에 이 목적은 선택된 기지의 돌연변이가 DNA 세그멘트에서 발생하는지 여부를 발견하는 것이다. 이 목적으로 12개 미만의 프로브면 충분한데, 5개의 프로브는 한 대립유전자에 대해 포지티브하고 5개는 다른 대립유전자에 대해 포지티브하고 2개는 둘다에 대해 네가티브하다. 샘플당 스코링될 프로브의 수가 적으므로 많은 수의 샘플이 동시에 분석될 수 있다. 예컨대 3교잡 싸이클에서 12개의 프로브를 사용하여 96개의 상이한 유전자 위치 또는 64명의 환자로 부터 나오는 유전자 세그멘트가 64명의 환자로 부터 동일한 DNA 세그멘트를 나타내는 64 도트를 갖는 12 ×24 소배열을 포함한 막에서 6 ×9 분석될 수 있다. 이 실시예에서 샘플은 64개의 96-웰 플레이트에 준비된다. 각 플레이트는 한 명의 환자에 대한 것이고 각 웰은 분석될 DNA 세그멘트중 하나를 나타낸다. 64 플레이트의 샘플이 동일한 막의 4 쿼트로서 4개의 복제로 스포팅된다.In the simplest case, the goal is to find out whether the selected known mutation occurs in the DNA segment. Less than 12 probes are sufficient for this purpose, with five probes positive for one allele, five positive for the other allele, and two negative for both. Since the number of probes to be scored per sample is small, a large number of samples can be analyzed simultaneously. For example, using 12 probes in a three-hybrid cycle, genes from 96 different gene positions or from 64 patients could be found on membranes containing 12 × 24 subarrays with 64 dots representing the same DNA segment from 64 patients. × 9 can be analyzed. In this example the samples are prepared in 64 96-well plates. Each plate is for one patient and each well represents one of the DNA segments to be analyzed. Samples of 64 plates are spotted in 4 replicates as 4 quarts of the same membrane.
96 세그멘트 각각에 대해 12 프로브 한 세트가 단일 채널 피펫팅 또는 단일 핀 전달장치(또는 개별적으로 조절된 피펫 또는 핀 배열에 의해)에 의해 선택되고 선택된 프로브가 12개의 96-웰 플레이트에 배열될 수 있다. 프로브가 리벨링되고 4개의 플레이트로 부터 나오는 프로브가 교잡 버퍼와 혼합되고 96 채널 피펫팅 장치에 의해 소배열에 첨가된다. 한 교잡싸이클후 증류안된 교잡 또는 세척 버퍼에서 37 내지 55℃로 막을 배양시켜 앞서 적용된 프로브를 벗겨낼 수 있다.One set of 12 probes for each of the 96 segments can be selected by a single channel pipetting or single pin delivery (or by individually controlled pipette or pin arrangement) and the selected probes can be arranged in 12 96-well plates . The probes are reveled and the probes from the four plates are mixed with the hybridization buffer and added to the subarray by a 96 channel pipetting device. After one hybridization cycle, the previously applied probe may be stripped off by incubating the membrane at 37-55 ° C. in an undistilled hybridization or wash buffer.
한 대립유전자에 대해 포지티브한 프로브가 포지티브이고 다른 대립유전자에 대해 포지티브한 프로브가 네가티브일 가능성이 두 대립 유전자중 어느 것이 존재하는지 여부를 결정하는데 사용될 수 있다. 이러한 과다한 스코링 스킴에서 각 프로브의 교잡시 어느 수준의 오차(10%)는 허용될 수 있다.A probe that is positive for one allele is positive and a probe that is positive for another allele can be used to determine whether either of the two alleles is likely to be negative. In this excessive scoring scheme, some level of error (10%) in the hybridization of each probe can be tolerated.
두 개의 대립유전자중 하나의 샘플에서 존재 또는 부재를 입증하는 하나 또는 두 개의 프로브가 대개의 대립유전자 스코링에 사용될 수 있다. 예컨대 4천개의 8-올리고머를 써서 무작위로 선택된 자리에 대해 두 개의 대립유전자중 하나에 대해 포지티브한 적어도 하나의 프로브를 발견할 확률은 91%이다. 불완전한 프로브 세트는 분석된 샘플에서 G+C 함량등을 반영하기 위해서 최적화될 수 있다.One or two probes may be used for most allele scoring, demonstrating presence or absence in a sample of one of the two alleles. For example, using 4,000 8-oligomers, the probability of finding at least one probe positive for one of the two alleles for a randomly selected site is 91%. Incomplete probe sets can be optimized to reflect G + C content and the like in the analyzed samples.
전체 유전자 서열화를 위해서 적절한 수의 세그멘트로 유전자가 증폭될 수 있다. 각 세그멘트에 대해서 한 세트의 프로브(2-4염기당 하나의 프로브)가 선택되고 교잡된다. 이들 프로브는 분석된 세그멘트에서 돌연변이 장소를 식별할 수 있다. 하나이상의 돌연변이 장소가 탐지되는 세그멘트(즉, 이들 세그멘트를 포함하는 소배열)는 추가 프로브와 교잡되어서 돌연변이 사이트에서 정확한 서열을 발견한다. DNA 샘플이 6-mer마다 테스트되고 포지티브 교잡된 프로브 TGCAA 및 TATTCC에 의해 에워싸이고 3개의 네가티브 프로브 CAAAAC, AAACTA 및 ACTATT에 의해 덮인 지점에서 돌연변이가 위치되면 돌연변이된 누클레오티드는 이 위치에서 정상 서열로 발생하는 A 또는 C이다. 이들은 단일 염기 돌연변이나 하나 이상의 누클레오티드 제거 또는 염기 AA, AC, CT간의 삽입에 의해 변화될 수 있다.Genes can be amplified in the appropriate number of segments for overall gene sequencing. One set of probes (one probe per 2-4 bases) is selected and hybridized for each segment. These probes can identify mutation sites in the analyzed segment. Segments in which one or more mutation sites are detected (ie, a small array comprising these segments) are hybridized with additional probes to find the correct sequence at the mutation site. If the DNA sample is tested by the 6-mer and surrounded by the positively hybridized probes TGCAA and TATTCC and the mutation is located at the point covered by the three negative probes CAAAAC, AAACTA and ACTATT, the mutated nucleotide occurs at the normal sequence at this position. A or C. These can be changed by single base mutations or by removal of one or more nucleotides or by insertion between bases AA, AC, CT.
한가지 방법은 한 누클레오티드에 대해 포지티브 교잡된 프로브 TGCAAA를 우측으로 연장하고 프로브 TATTCC를 한 누클레오티드 만큼 좌측으로 연장하는 프로브를 선택하는 것이다. 이들 8개의 프로브(GCAAAA, GCAAAT, GCAAAC, GCAAAG, ATATTC, TTATTC, CTATTC, GTATTC)를 사용하여 두 개의 누클레오티드가 결정된다.One method is to select a probe that extends the positive hybridized probe TGCAAA to the right for one nucleotide and the probe TATTCC to the left by one nucleotide. Two nucleotides are determined using these eight probes (GCAAAA, GCAAAT, GCAAAC, GCAAAG, ATATTC, TTATTC, CTATTC, GTATTC).
돌연변이에 대한 가장 그럴듯한 가설이 결정될 수 있다. 예컨대, A가 G로 돌연변이 된 것으로 발견된다. 이 결과를 만족시키는 두가지 방법이 있다. A가 G로 대체된 것이 유일한 변화이거나 새로 결정된 G와 다음 C간에 일부 염기의 삽입이 있다. 만약 연결 프로브를 사용한 결과가 네가티브이며 돌연변이된 위치를 포함하는 하나 이상의 연결 프로브 (AAGCTA)와 추가 8개의 프로브(CAAAGA, CAAAGT, CAAAGC, CAAAGG, ACTATT, TCTATT, CCTATT, GCTATT)에 의해 이 옵션이 검토될 수 있다. 돌연변이 해결 프로브를 선택하는 다른 여러 가지 방법이 있다.The most plausible hypothesis for mutation can be determined. For example, A is found to be mutated to G. There are two ways to satisfy this result. The only change in which A has been replaced by G is the insertion of some base between the newly determined G and the next C. If the results of linking probes are negative, this option is reviewed by one or more linking probes (AAGCTA) containing the mutated position and by eight additional probes (CAAAGA, CAAAGT, CAAAGC, CAAAGG, ACTATT, TCTATT, CCTATT, GCTATT). Can be. There are many other ways to select mutation resolution probes.
그 배체의 경우에 테스트 샘플과 동질 접합체 기준에 대한 스코어 비교가 수행되어서 이질접합체를 식별할 수 있다. 몇 개의 연속 프로브는 이들 프로브에 의해 커버링된 세그멘트가 두 개의 염색체중 하나에서 돌연변이 되면 대략 2배의 적은 신호를 가질 것이다.In the case of embryos, score comparisons to test samples and homozygous criteria can be performed to identify heterozygotes. Several consecutive probes will have approximately two times less signal if the segments covered by these probes are mutated on one of the two chromosomes.
실시예 20: 유전장애 및 기타 특성에 책임있는 유전자(돌연변이) 식별Example 20 Identification of Genes (Mutations) Responsible for Genetic Disorders and Other Properties
고정된 샘플 배열상에 더 긴 프로브(8-mer 또는 9-mer) 세트를 사용하여 5-20kb 정도 긴 DNA 단편이 서브클로닝 없이 서열화될 수 있다. 게다가, 서열화 속도는 1천만bp/일/교잡기기이다. 이러한 성능은 과학적 또는 의학적으로 흥미진진한 개인으로 부터 나온 인간 유전자 또는 게놈을 상당 부분 재서열화할 수 있게 한다. 인간 유전자의 50%를 재서열화 하기 위해서 약 1억 bp가 검사된다. 이것은 적당한 비용으로 비교적 짧은 기간에 수행될 수 있다.DNA fragments as long as 5-20 kb can be sequenced without subcloning using longer sets of probes (8-mer or 9-mer) on a fixed sample array. In addition, the sequencing rate is 10 million bp / day / hybridizer. This capability allows for the substantial re-sequencing of human genes or genomes from scientific or medically interesting individuals. Approximately 100 million bp are tested to resequence 50% of the human genes. This can be done in a relatively short period of time at a reasonable cost.
이렇게 무궁무진한 재서열화 능력이 다양한 방식으로 장애 또는 기타 특징을 부호화하는 유전자 또는 돌연변이를 식별하는데 사용될 수 있다. 기본적으로 특정 장애를 갖는 환자의 게놈 DNA 또는 특정 조직에서 나온 mRNA(cDNA로 전환가능한)가 출발물질로서 사용된다. 두가지 DNA 소스로 부터 적당한 길이의 분리된 유전자 또는 게놈 단편이 클로닝 절차나 인 비트로 증폭절차(PCR)에 의해 제조될 수 있다. 클로닝이 사용되면 분석될 최소 세트의 클론이 서열화에 앞서 라이브러리로 부터 선택된다. 이것은 특히 5kb보다 긴 소수의 클론이 분류될 수 있다면 소수의 프로브의 교잡에 의해 효과적으로 수행될 수 있다. 클로닝은 교잡 데이타의 양을 약 2배 증가시키지만 수만개의 PCR 프라이머를 필요로 하지 않는다.This infinite resequencing ability can be used to identify genes or mutations that encode disorders or other features in a variety of ways. Basically, genomic DNA of a patient with a specific disorder or mRNA from a specific tissue (convertible to cDNA) is used as a starting material. Separate genes or genomic fragments of appropriate length from two DNA sources can be prepared by cloning procedures or in vitro amplification procedures (PCR). If cloning is used, the minimum set of clones to be analyzed is selected from the library prior to sequencing. This can be done effectively by hybridization of a few probes, especially if a few clones longer than 5 kb can be sorted. Cloning increases about twice the amount of hybridization data but does not require tens of thousands of PCR primers.
한가지 변형 절차에서 유전자 또는 게놈 단편이 다음 방식으로 DNA를 절단하는 Hga I과 같은 효소를 사용한 제한 절단에 의해 제조될 수 있다: GACGC(N5')/CTGCG(N10') 5개의 염기중 돌출한 단부는 상이한 단편의 경우에 다르다. 하나의 효소는 특정수의 유전자에 대해 적절한 단편을 생성한다. cDNA 또는 게놈 DNA를 별도의 반응에서 여러 가지 효소로 절단함으로써 모든 관심 유전자가 적절하게 절제된다. 한 방법에서, 절단된 DNA가 크기별로 분리된다. 이러한 방식으로 제조된 DNA 단편(3' 단부로 부터 누클레오티드를 제거하여 단부의 특이성 및 길이를 증가시키는 엑소누클레아제 Ⅲ로 보충 처리되는)이 튜브 또는 다중웰 플레이트에 분배된다. 적당한 길이의 가변적 돌출단부와 공통부분을 갖는 DNA 어뎁터 세트로 부터 증폭될 필요가 있는 유전자 단편에 대해 한쌍의 어뎁터가 선택될 수 있다. 이들 어뎁터는 리게이션 반응되고 범용 프라이머에 의해 PCR이 수행된다. 1000개의 어뎁터로 부터 백만쌍이 발생되고 100만개의 상이한 단편이 어뎁터의 공통단부에 상보적인 범용 프라이머쌍을 사용하여 동일한 조건에서 증폭될 수 있다.In one modification procedure, a gene or genomic fragment can be prepared by restriction digest using an enzyme such as Hga I to cleave DNA in the following manner: GACGC (N5 ′) / CTGCG (N10 ′) Protruding end of 5 bases Is different for different fragments. One enzyme produces an appropriate fragment for a certain number of genes. All genes of interest are appropriately excised by cleaving the cDNA or genomic DNA with different enzymes in separate reactions. In one method, the cleaved DNA is separated by size. DNA fragments prepared in this manner (treated with exonuclease III, which removes nucleotides from the 3 'end to increase the specificity and length of the end) are dispensed into tubes or multiwell plates. A pair of adapters can be selected for the gene fragments that need to be amplified from a set of DNA adapters having variable lengths and consensus portions of appropriate length. These adapters are ligation reactions and PCR is performed by general purpose primers. One million pairs are generated from 1000 adapters and one million different fragments can be amplified under the same conditions using universal primer pairs complementary to the common ends of the adapters.
여러 환자에게서 DNA 차이가 반복된 것으로 발견되고 서열 변화가 무의미하거나 해당 단백질의 기능을 변화시킬 수 있다면 돌연변이된 유전자가 장애의 원인이다. 특별한 특징을 갖는 여러명의 개인을 분석함으로써 특정 유전자의 기능적 대립유전자 변화가 특별한 특징과 관련될 수 있다.If multiple DNA differences are found in many patients and sequence changes are insignificant or can alter the function of the protein, the mutated gene is the cause of the disorder. By analyzing several individuals with particular characteristics, functional allele changes in a particular gene can be associated with that particular characteristic.
이 방법은 혈톤에 대한 값비싼 유전자 지도의 필요성을 제거하며 이러한 유전자 데이타 또는 재료가 없을 때 특별한 가치를 갖는다.This method eliminates the need for expensive genetic maps for blood tones and has particular value in the absence of such genetic data or materials.
실시예 21: 유전자 지도에서 단일 누클레오티드 다형성 스코링Example 21: Single Nucleotide Polymorphic Scoring in Gene Maps
본 출원에 발표된 기술은 단일 누클레오티드 다형성(SNUPs)을 갖는 게놈 단편의 효율적 식별에 적합하다. 생체밖 증폭이나 클로닝에 의해 증폭될 수 있는 기지 서열의 게놈 단편에 앞서 기술된 서열화 공정을 적용함으로써 10명에게서 SNUPs을 갖는 충분한 수의 DNA 세그멘트가 식별될 수 있다. 다형성 단편은 SNUP 마커로서 사용되기도 한다. 이러한 마커는 앞선 방식으로 매핑되거나 아래에 기술된 방식으로 스크린잉 절차를 통해 매핑될 수 있다.The technique disclosed in this application is suitable for efficient identification of genomic fragments with single nucleotide polymorphisms (SNUPs). A sufficient number of DNA segments with SNUPs can be identified in 10 by applying the sequencing process described above to genomic fragments of known sequences that can be amplified by ex vivo amplification or cloning. Polymorphic fragments are also used as SNUP markers. Such markers may be mapped in the foregoing manner or through a screening procedure in the manner described below.
마커를 증폭하고 이들을 소배열 형태로 배열함으로써 관련 가족 또는 집단으로 부터 매 개인에게서 SNUPs가 스코링될 수 있다. 소배열은 분석된 개인으로 부터 증폭된 동일한 마커를 포함한다. 알려진 돌연변이의 진단에서 처럼 각 마커에 대해서 한 대립유전자에 대해 포지티브한 6개 이하의 프로브 세트와 다른 대립 유전자에 대해 포지티브한 6개 이하의 프로브 세트가 선택 및 스코링된다. 장애를 갖는 마커그룹으로 부터 책임 유전자의 염색체 위치가 결정될 수 있다. 높은 산출량 및 저렴한 비용 때문에 수천명에 대해 수천개의 마커가 스코링될 수 있다. 이러한 데이타는 백만 bp미만의 해상도로 유전자의 국지화와 다원 유전자 질병에 관련된 유전자의 국지화를 가능하게 한다. 국지화된 유전자는 정상인과 환자로 부터 특정 지역을 서열화 하여 돌연변이를 스코링 함으로써 식별될 수 있다.By amplifying the markers and arranging them in subarray form, SNUPs can be scored in each individual from the family or population concerned. The subarray includes the same markers amplified from the analyzed individuals. As in the diagnosis of known mutations, for each marker, up to six probe sets positive for one allele and up to six probe sets positive for the other allele are selected and scored. The chromosomal location of the responsible gene can be determined from the group of markers with the disorder. Thousands of markers can be scored for thousands of people because of high throughput and low cost. These data enable localization of genes at resolutions below one million bp and localization of genes involved in multiple gene diseases. Localized genes can be identified by scoring mutations by sequencing specific regions from normal individuals and patients.
게놈 DNA로 부터 마커의 증폭에 PCR이 선호된다. 각 마커는 특정 프라이머쌍을 필요로 한다. 기존의 마커가 전환가능하거나 Hga I형 제한효소에 의한 게놈 DNA 절단이나 한쌍의 어뎁터를 사용한 리게이션 반응에 의해 제조가능한 새로운 마커가 한정될 수 있다.PCR is preferred for amplification of markers from genomic DNA. Each marker requires a specific primer pair. Existing markers may be converted or new markers prepared by genomic DNA cleavage by Hga type I restriction enzyme or by ligation reaction using a pair of adapters may be defined.
SNUP 마커는 개별 증폭 반응의 수를 감소시키는 푸울로서 증폭될 수 있다. 이 경우에 한 샘플에 대해 더 많은 프로브가 스코링된다. 4개의 마커가 모아져서 12개의 복제막상에 스포팅될 때 48 프로브(마커마다 12개)가 4싸이클에서 스코링될 수 있다.SNUP markers can be amplified as pools reducing the number of individual amplification reactions. In this case more probes are scored for one sample. When four markers are collected and spotted on 12 replicates, 48 probes (12 per marker) can be scored in 4 cycles.
실시예 22: DNA 단편의 종류 탐지 및 검증Example 22 Detection and Verification of Kinds of DNA Fragments
제한 절단, 클로닝 또는 생체밖 증폭(PCR)에 의해 발생된 DNA 단편이 실험에서 식별된다. 식별은 겔 전기영동상에서 특정 크기의 DNA 밴드를 확인하여 수행된다. 혹은, 특정 올리고누클레오티드가 제조되고 교잡에 의해 문제의 DNA 샘플 검증에 사용된다. 여기서 개발된 절차는 각 단편에 대해 특정 올리고누클레오티드를 제조하지 않고도 많은 수의 샘플을 더욱 효과적으로 식별할 수 있게 한다. 포지티브 및 네가티브 프로브 세트가 알려진 서열을 기초하여 각 단편에 대한 범용 세트로 부터 선택될 수 있다. 포지티브 하다고 선택된 프로브가 하나 또는 수개의 중첩 그룹을 형성할 수 있고 네가티브 프로브가 전체 인서트상에 확산된다.DNA fragments generated by restriction digestion, cloning or ex vivo amplification (PCR) are identified in the experiment. Identification is performed by identifying DNA bands of specific size on gel electrophoresis. Alternatively, specific oligonucleotides are prepared and used to validate the DNA sample in question by hybridization. The procedure developed here allows for more effective identification of large numbers of samples without preparing specific oligonucleotides for each fragment. Positive and negative probe sets can be selected from the universal set for each fragment based on known sequences. A probe selected to be positive may form one or several overlapping groups and the negative probe spreads over the entire insert.
이 기술은 YAC 클론상의 매핑과정에서 STS의 식별에 사용될 수 있다. 각 STS가 100 YAC 클론 또는 YAC 클론 푸울상에서 테스트될 수 있다. 100개의 반응에서 나온 DNA가 한 개의 소배열에 스포팅된다. 상이한 STS는 연속 소배열을 나타낸다. 여러 교잡 싸이클에서 각 DNA 샘플에 대해 한가지 기호가 발생되고 필요한 유의수준으로 주어진 YAC 클론에 특정 STS의 존재 확인에 사용된다.This technique can be used to identify the STS during mapping on the YAC clone. Each STS can be tested on 100 YAC clones or YAC clone pools. DNA from 100 reactions is spotted in one subarray. Different STSs represent consecutive subarrays. In several hybridization cycles, one symbol is generated for each DNA sample and used to confirm the presence of a specific STS in a given YAC clone at the required significance level.
독립적인 PCR 반응의 횟수나 스포팅을 위한 샘플의 수를 감소시키기 위해서 한 반응에서 수개의 STS가 동시에 증폭되거나 PCR 샘플이 혼합될 수 있다. 이 경우에 한 도트에 대해 더 많은 프로브가 스코링되어야 한다. STS의 푸울링은 YAC 푸울링과 무관하고 단일 YAC 또는 YAC 푸울에 대해 사용될 수 있다. 이 스킴은 특히 상이한 색깔로 라벨링된 여러개의 라벨이 함께 교잡될 때 이득이 된다.In order to reduce the number of independent PCR reactions or the number of samples for spotting, several STSs may be amplified simultaneously in one reaction or PCR samples may be mixed. In this case more probes have to be scored for one dot. The pooling of the STS is independent of the YAC pooling and can be used for a single YAC or YAC pool. This scheme is particularly beneficial when several labels labeled with different colors are hybridized together.
한 샘플에서 DNA 단편의 존재 확인에 추가적으로 수개의 분리된 프로브 또는 하나 이상의 프로브 푸울의 교잡 세기를 사용하여 DNA 양이 평가될 수 있다. DNA 양이 알려진 비교 샘플의 세기와 수득된 세기를 비교함으로써 모든 스포팅된 샘플의 DNA 양이 동시에 측정된다. 단지 소수의 프로브가 DNA 단편 식별에 필요하고 N 염기 길이의 DNA에 사용될 수 있는 N개의 가능한 프로브가 있으므로 DNA 세그멘트의 식별에 많은 프로브 세트를 필요로 하지 않는다. 천개의 8-mer로 부터 평균 30개의 완전 일치 프로브가 1000bp 단편에 대해 선택될 수 있다.The amount of DNA can be assessed using the hybridization intensity of several separate probes or one or more probe pools in addition to confirming the presence of DNA fragments in one sample. The DNA amount of all spotted samples is measured simultaneously by comparing the intensity of the DNA with the strength of the known comparative sample. Since only a few probes are needed for DNA fragment identification and there are N possible probes that can be used for N base length DNA, the identification of DNA segments does not require many probe sets. An average of 30 exact match probes from a thousand 8-mers can be selected for a 1000 bp fragment.
실시예 23: 전염성 질병 생물과 그 변종 식별Example 23 Identification of Infectious Disease Organisms and Variants thereof
바이러스, 박테리아, 균 및 기타 기생생물 탐지를 위한 DNA-기초 테스트는 다른 방법보다 더 신뢰성 있고 덜 비싸다. DNA 테스트의 주요 장점은 특정 균주 및 돌연변이를 식별할 수 있고 더 효과적인 치료를 할 수 있다는 것이다.DNA-based tests for detecting viruses, bacteria, bacteria and other parasites are more reliable and less expensive than other methods. The main advantage of DNA testing is that it can identify specific strains and mutations and allow for more effective treatment.
박테리아 감염에서 12개의 항체 저항성 유전자가 이들 유전자를 증폭함으로써 테스트될 수 있다. 128명의 환자로 부터 증폭된 생성물이 두 개의 소배열에 스포팅되고 12개의 유전자에 대해 24개의 소배열이 8 ×12㎝ 막에서 4회 반복된다. 각 유전자에 대해 12개의 프로브가 포지티브 및 네가티브 스코링을 위해 선택될 수 있다. 교잡이 3싸이클로 수행된다. 테스트를 위해서 훨씬 적은 프로브 세트가 보편적이다. 예컨대, 천개의 8-mer 세트로 부터 평균 30개의 프로브가 1000bp 단편에서 포지티브이고 10개의 포지티브 프로브가 고신뢰성 식별에 충분하다. 실시예 9에서 처럼 여러개의 유전자가 함께 증폭 또는 스포팅되고 주어진 DNA의 양이 측정될 수 있다. 증폭된 유전자의 양은 전염 수준의 평가에 사용될 수 있다.Twelve antibody resistance genes in bacterial infections can be tested by amplifying these genes. The amplified product from 128 patients was spotted in two subarrays and 24 subarrays for 12 genes were repeated four times on an 8 × 12 cm membrane. Twelve probes for each gene can be selected for positive and negative scoring. Hybridization is performed in three cycles. Much fewer probe sets are common for testing. For example, an average of 30 probes from a thousand 8-mer set is positive in a 1000 bp fragment and 10 positive probes are sufficient for high reliability identification. As in Example 9 several genes can be amplified or spotted together and the amount of DNA given can be measured. The amount of gene amplified can be used to assess the level of transmission.
또다른 예는 HIV 바이러스의 전체 게놈 또는 하나의 유전자 서열화에 관계된다. 신속한 변화 때문에 이 바이러스는 최적 치료의 선택에 많은 곤란을 제공한다. 최대 64명의 환자로 부터 분리된 바이러스에서 DNA 단편이 증폭되고 기술된 절차에 의해 재서열화될 수 있다. 수득된 서열에 기초하여 최적의 치료법이 선택될 수 있다. 기본 서열(이질 접합체와 유사한)을 갖는 두가지 종류의 바이러스 혼합물이 있을 경우에 교잡 스코어를 다른 샘플(특히 기본 바이러스종만을 포함한 비교샘플)의 스코어와 정량 비교하여 돌연변이가 식별될 수 있다. 샘플에 존재하는 두 개의 바이러스중 하나에서 돌연변이된 사이트를 커버링하는 3 내지 4개의 프로브에 대해 두배정도 적은 스코어가 수득될 수 있다.Another example relates to the entire genome or one gene sequencing of the HIV virus. Because of the rapid change, this virus presents a great deal of difficulty in the selection of an optimal treatment. DNA fragments in viruses isolated from up to 64 patients can be amplified and resequenced by the described procedure. The optimal treatment can be selected based on the sequences obtained. Mutations can be identified by quantitatively comparing hybridization scores with scores of other samples (particularly comparative samples containing only basic viral species) in the presence of two kinds of viral mixtures having a base sequence (similar to a heterologous conjugate). A score twice as low can be obtained for three to four probes covering the mutated site in one of the two viruses present in the sample.
실시예 24: 법의학 및 친권 식별Example 24 Forensic and Parental Rights Identification
서열 다형성은 각 게놈 DNA를 고유하게 한다. 이것은 범죄현장으로 부터 나오는 혈액 또는 기타 신체유체 또는 조직을 분석하여 용의자로 부터 취한 샘플과 비교할 수 있게 한다. 충분한 수의 다형성 사이트가 스코링되어서 샘플의 고유한 기호를 생성한다. SBH는 단일 누클레오티드 다형성을 쉽게 스코링하여 이러한 기호를 발생한다.Sequence polymorphism makes each genomic DNA unique. This allows blood or other body fluids or tissue from the crime scene to be analyzed and compared with samples taken from the suspect. A sufficient number of polymorphic sites are scored to create unique symbols of the sample. SBHs generate this symbol by easily scoring a single nucleotide polymorphism.
한 세트의 DNA 단편(10-100)이 샘플과 용의자로 부터 증폭될 수 있다. 하나의 단편을 나타내는 용의자와 샘플에서 나오는 DNA가 하나 또는 수개의 소배열에 스포팅되고 각 소배열이 4번 복제된다. 3싸이클에서 12개의 프로브가 각 DNA 자리를 위해 용의자를 포함한 각 샘플에서 대립유전자 A 또는 B의 존재를 결정한다. 샘플과 용의자의 패턴 일치는 범법자를 발견할 수 있게 한다.One set of DNA fragments (10-100) can be amplified from the sample and the suspect. The suspect from one fragment and the DNA from the sample are spotted into one or several subarrays and each subarray is replicated four times. Twelve probes in three cycles determine the presence of allele A or B in each sample including the suspect for each DNA site. Pattern matching of the sample and the suspect makes it possible to detect the offender.
동일한 절차가 어린이의 부모 확인에 적용될 수 있다. DNA가 준비되고 어린이와 어른으로 부터 다형성 위치가 증폭된다. 교잡에 의해 A 또는 B 대립 유전자의 패턴이 결정된다. 수득된 패턴은 포지티브 및 네가티브 비교 샘플과 비교하여 친족관계를 결정한다. 이 경우에 대립유전자의 상당 부분이 부모와 일치할 필요가 있다. 많은 수의 스코링된 자리는 새로운 돌연변이의 마스킹 효과나 통계적 에러를 방지할 수 있게 한다.The same procedure can be applied to parental identification of a child. DNA is prepared and polymorphic sites are amplified from children and adults. Hybridization determines the pattern of the A or B allele. The pattern obtained determines kinship compared to positive and negative comparison samples. In this case, much of the allele needs to match the parent. A large number of scored sites can prevent the masking effects or statistical errors of new mutations.
실시예 25: 집단 또는 종의 유전적 다양성과 생태학적 장소의 생물학적 다양성 평가Example 25 Assessment of Genetic Diversity of Populations or Species and Biological Diversity of Ecological Sites
상당수의 자리에서(예컨대 몇 개의 유전자나 전체 미토콘드리아 DNA) 대립유전자 변형 빈도의 측정은 환경이 유전자형, 종의 진화나 역사 또는 질병이나 소멸 가능성에 미치는 효과에 대한 다양한 결론을 내릴 수 있게 한다. 이러한 평가는 알려진 특정 대립유전자를 테스트하거나 어떤 자리를 완전 재서열화하여 환경에 미세한 변화나 돌연변이 유발요인의 존재를 나타낼 수 있는 새로운 돌연변이를 한정할 수 있다.At many sites (eg, several genes or whole mitochondrial DNA), measuring allelic frequency can lead to various conclusions about the effects of the environment on genotype, species evolution or history, or the likelihood of disease or extinction. This assessment can test for specific known alleles or fully resequence sites to define new mutations that may indicate the presence of microscopic changes or mutagens.
추가로, 미생물 세계에서 생물학적 다양성이 리보소옴 RNA의 유전자나 고보존성 단백질의 유전자와 같은 진화적으로 보존된 DNA 재서열화에 의해 연구될 수 있다. DNA가 환경에서 취해지고 특정 유전자가 보존성 서열에 해당하는 프라이머를 사용하여 증폭된다. DNA 단편이 플라스미드 벡터에서 클로닝되거나 다중웰 플레이트에서 웰당 한분자 수준까지 희석되고 생체밖 증폭된다. 이렇게 제조된 클론이 기술된 방식으로 재서열화 된다. 두가지 정보가 수득된다. 우선, 각 종의 밀도와 상이한 종의 카탈로그가 한정된다. 또다른 정보는 생태학적 인자나 오염이 생태계에 미치는 효과를 측정하는데 사용될 수 있다. 이것은 어떤 종이 멸종되거나 종간의 비율이 오염 때문에 변경되는지 여부를 밝혀준다. 이 방법은 화석으로부터 DNA 서열화에 적용가능하다.In addition, biological diversity in the microbial world can be studied by evolutionarily conserved DNA resequencing, such as genes of ribosomal RNA or genes of highly conserved proteins. DNA is taken from the environment and specific genes are amplified using primers corresponding to conservative sequences. DNA fragments are cloned in plasmid vectors or diluted to one molecule level per well in multiwell plates and amplified ex vivo. Clones thus prepared are resequenced in the manner described. Two pieces of information are obtained. First, catalogs of species different from the density of each species are defined. Another piece of information can be used to measure the effects of ecological factors or pollution on ecosystems. This reveals whether any species are extinct or the proportions of species change due to contamination. This method is applicable to DNA sequencing from fossils.
실시예 26: 핵산 종의 탐지 또는 정량화Example 26 Detection or Quantification of Nucleic Acid Species
기질에 고정된 표지안된 프로브와 용액에서 라벨링된 프로브를 포함하는 프로브쌍을 사용하여 DNA 또는 RNA 종이 탐지 및 정량될 수 있다. 이 종은 라벨링된 프로브와 리가아제의 존재하에 표지안된 프로브에 노출시켜 탐지 및 정량될 수 있다. 특히, 샘플 핵산 골격상에 표지된 및 표지안된 프로브의 리게이션에 의한 연장된 프로브의 형성은 탐지될 종의 존재를 나타낸다. 따라서, 리게이션 안된 표지된 프로브 제거후 기질상의 배열에서 특정 지점에 라벨의 존재는 샘플종의 존재를 나타내며 라벨의 양은 종의 발현 수준을 나타낸다.DNA or RNA species can be detected and quantified using probe pairs comprising unlabeled probes immobilized on a substrate and labeled probes in solution. This species can be detected and quantified by exposure to unlabeled probes in the presence of labeled probes and ligase. In particular, the formation of extended probes by the ligation of labeled and unlabeled probes on the sample nucleic acid backbone indicates the presence of the species to be detected. Thus, the presence of a label at a particular point in the matrix array after removal of the unligated labeled probe indicates the presence of the sample species and the amount of label indicates the expression level of the species.
혹은 하나 이상의 표지안된 프로브가 쌍의 제 1 요소로서 용액에 도입될 하나 이상의 표지된 프로브와 함께 기질상에 배열될 수 있다. 한가지 방법에 따르면 구별가능한 파장에서 형광성인 염료를 사용하여 배열상에서 라벨의 멀티플렉싱이 수행될 수 있다. 이러한 방식으로, 식별될 종에 대해 특이적인 표지된 및 표지안된 프로브쌍과 함께 배열에 적용된 cDNA 혼합물이 cDNA 종의 존재나 발현 수준 평가를 위해 검사된다. 한 구체예에서 이 방법은 탐지될 cDNA 서열을 따라 중첩하는 서열을 포함하는 라벨링된 및 표지안된 프로브쌍을 선택함으로써 cDNA 일부를 서열화시킬 수 있다. 타겟 병원성 게놈 유기체에서 조합으로 나타나는 선택된 프로브쌍을 조성에 포함시킴으로써 특정 병원체 게놈의 존재 및 양을 탐지할 수 있다. 따라서, 어떠한 단일 프로브쌍도 병원체 게놈에 대해 특이적일 필요는 없지만 쌍의 조합은 그래야 한다. 유사하게, cDNA 탐지 또는 서열화시 특정 프로브가 cDNA 또는 다른 종에 특이적이지 않는 경우가 발생할 수 있다. 그럼에도 불구하고 특정종의 존재 및 양이 측정되어서 상이한 배열에 위치한 선택된 프로브의 조합이 특정 종의 존재를 나타낸다.Alternatively, one or more unlabeled probes can be arranged on the substrate with one or more labeled probes to be introduced into the solution as a pair of first elements. According to one method, multiplexing of labels on an array can be performed using dyes fluorescent at distinguishable wavelengths. In this way, the cDNA mixture applied to the array with labeled and unlabeled probe pairs specific for the species to be identified is examined for assessing the presence or expression level of the cDNA species. In one embodiment, the method can sequence a portion of the cDNA by selecting labeled and unlabeled probe pairs that include overlapping sequences along the cDNA sequence to be detected. The presence and amount of specific pathogen genomes can be detected by including in the composition selected pairs of probes that appear in combination in the target pathogenic genomic organism. Thus, no single pair of probes need to be specific for the pathogen genome but the combination of pairs should be. Similarly, when cDNA detection or sequencing may occur, certain probes are not specific for cDNA or other species. Nevertheless, the presence and amount of a particular species is measured such that a combination of selected probes located in different configurations indicates the presence of the particular species.
10kb 이상의 DNA를 갖는 전염원이 PCR 또는 기타 타겟 증폭 절차를 사용하지 않고도 담체 결합 탐지 칩을 사용하여 탐지될 수 있다. 다른 방법에 따르면 박테리아 및 비루스를 포함한 전염원의 게놈이 PCR을 통한 단일 타겟 누클레오티드 서열 증폭과 타겟 서열에 대해 특이적인 표지된 프로브의 교잡에 의해 평가된다. 이러한 평가는 단일 타겟 서열에 대해서만 특이적이므로 탐지가능한 신호발생을 위해 충분한 타겟을 제공하도록 PCR과 같은 방법에 의해 유전자를 증폭할 필요가 있다.Progenitors with DNA greater than 10 kb can be detected using a carrier binding detection chip without using PCR or other target amplification procedures. According to another method, genomes of infectious agents, including bacteria and viruses, are assessed by amplifying single target nucleotide sequences via PCR and hybridization of labeled probes specific for the target sequence. Since this evaluation is specific to a single target sequence only, it is necessary to amplify the gene by methods such as PCR to provide enough targets for detectable signaling.
이 실시예에 따르면 포맷 3-타입 반응을 통해 전염원의 누클레오티드 서열 특성을 탐지하는 개선된 방법이 제공되는데, 전염원에 특이적인 다양한 고정화 올리고누클레오티드 프로브 배열을 포함한 고체상 탐지칩이 제조된다. 타겟 핵산에 상보적인 표지안된 프로브 혼합물을 포함한 단일 도트가 한 위치에서 종에 특이적인 라벨을 농축시킴으로써 확산 또는 단일 프로브 라벨링에 대한 민감도를 향상시킨다. 이러한 다중 프로브는 타겟 누클레오티드 서열의 중첩 서열일 수 있지만 인접하지 않고 중첩되지 않은 서열일 수 있다. 이러한 프로브는 5 내지 12개의 누클레오티드 길이를 가진다.This example provides an improved method for detecting the nucleotide sequence properties of an infectious agent via a format 3-type reaction, wherein a solid-state detection chip comprising various immobilized oligonucleotide probe arrays specific for the infectious agent is prepared. A single dot comprising an unlabeled probe mixture complementary to the target nucleic acid enhances sensitivity to diffusion or single probe labeling by concentrating the species specific label in one location. Such multiple probes may be overlapping sequences of target nucleotide sequences but may be sequences that are not contiguous and not overlapping. Such probes have a length of 5 to 12 nucleotides.
샘플에 존재하는 타겟 서열과 프로브 배열에 노출된 핵산 샘플은 여러 고정된 프로브를 써서 교잡반응된다. 고정된 프로브에 인접한 타겟 서열에 특이 결합하도록 선택된 표지된 프로브 푸울이 샘플과 함께 표지안된 올리고누클레오티드 프로브 혼합물 배열에 적용된다. 이후에 칩에 리가아제가 적용되어서 샘플상의 인접 프로브를 연결시킨다. 이후에 탐지칩이 세척되어서 교잡 안되고 연결안된 프로브와 샘플 핵산을 제거하고 라벨의 존재 여부에 따라 샘플 핵산의 존재가 탐지될 수 있다. 이 방법은 샘플 농도를 1000배 감소시킨 샘플을 신뢰성있게 탐지할 수 있게 한다.The nucleic acid sample exposed to the target sequence and probe array present in the sample is hybridized using several immobilized probes. Labeled probe pools selected to specifically bind to target sequences adjacent to the immobilized probes are applied to the unlabeled oligonucleotide probe mixture array with the sample. The ligase is then applied to the chip to connect adjacent probes on the sample. After that, the detection chip may be washed to remove the hybridized and unlinked probe and the sample nucleic acid, and the presence of the sample nucleic acid may be detected depending on the presence of the label. This method makes it possible to reliably detect samples with 1000-fold reductions in sample concentration.
본 발명의 또다른 측면으로서 표지된 프로브의 신호가 염색체, 효소 또는 방사능 라벨을 포함하거나 다중 라벨링된 추가 프로브에 의해 특이 결합가능한 자유 프로브에 공통 꼬리를 제공함으로써 증폭될 수 있다. 이러한 방식으로 제 2 라운드 신호증폭이 수행된다. 표지된 또는 표지안된 프로브가 제 2 신호증폭에 사용된다. 제 2 증폭에서 다중 라벨을 갖는 긴 DNA 샘플이 증폭 신호를 10 내지 100배 증가시켜서 총 100,000의 신호증폭을 가져온다. 약 100,000배의 신호는 PCR 또는 기타 증폭절차를 사용할 필요없이 프로브-DNA 결합을 가져올 수 있다.As another aspect of the invention, the signal of a labeled probe can be amplified by providing a common tail to a free probe specifically binding to a chromosome, enzyme or radiolabel or by multiple labeled additional probes. In this way, the second round signal amplification is performed. Labeled or unlabeled probes are used for the second signal amplification. Long DNA samples with multiple labels in the second amplification increase the amplification signal by 10 to 100 times resulting in a total of 100,000 signal amplifications. An approximately 100,000-fold signal can result in probe-DNA binding without the need for PCR or other amplification procedures.
본 발명의 또다른 측면에 따르면 예컨대 4096개의 6-mer 프로브로 구성된 배열이 제조될 수 있다. 이러한 배열은 모든 핵산종의 탐지 또는 완전 서열화에 사용될 수 있다는 점에서 범용이다. 배열에서 각 스포트는 단일 프로브 종이나 단일 반응으로 합성된 N(1-3) B(4-6) N(1-3) 타입 혼합물을 포함할 수 있다. N은 4개의 누클레오티드, B는 한 개의 누클레오티드이고 관련 수치에서 1-3은 1-3 염기를 나타낸다. 이 혼합물은 동일한 길이의 핵산종 분자의 상이한 부분으로 부터 나오는 신호를 수집하여 저농도로 존재하는 핵산 종에 대해 더 강한 신호를 제공한다. 이 범용 프로브 집합은 샘플 및 라벨링된 프로브를 갖는 교잡 버퍼의 확산을 방지하는 장벽에 의해 분리된 단위 배열로서 스포팅되는 여러 부분집합으로 분할될 수 있다.According to another aspect of the invention an array of, for example, 4096 6-mer probes can be produced. This arrangement is universal in that it can be used for the detection or complete sequencing of all nucleic acid species. Each spot in the array may comprise a single probe species or a N (1-3) B (4-6) N (1-3) type mixture synthesized in a single reaction. N is four nucleotides, B is one nucleotide and 1-3 in the relevant figures represent 1-3 bases. This mixture collects signals from different portions of the nucleic acid species molecules of the same length to provide stronger signals for nucleic acid species present at low concentrations. This universal probe set can be divided into several subsets spotted as unitary units separated by barriers that prevent the diffusion of hybridization buffers with samples and labeled probes.
서열이 알려진 핵산종 탐지를 위해 용액에든 라벨링된 프로브와 고정된 표지안된 프로브를 둘다 포함한 하나 이상의 올리고누클레오티드 서열이 선택될 수 있다. 표지된 프로브는 사전 합성된 예컨대 7-mer 세트로 부터 선택되거나 합성된다. 표지된 프로브는 고정된 프로브와 표지된 프로브의 쌍이 타겟 서열에 인접 교잡하여서 리가아제 투여시 프로브가 공유 결합되도록 고정된 프로브 단위 배열에 첨가된다.One or more oligonucleotide sequences can be selected that include both labeled and immobilized unlabeled probes in solution for detection of known nucleic acid species. Labeled probes are selected or synthesized from presynthesized such as 7-mer sets. Labeled probes are added to a fixed probe unit array such that a pair of immobilized and labeled probes hybridize adjacent to the target sequence such that the probes are covalently bound upon ligase administration.
단위배열이 주어진 핵산종에 포지티브한 하나 이상의 고정된 프로브를 포함할 경우(분리된 스포트로서 또는 동일 스포트내에서) 모든 라벨링된 프로브가 혼합되고 동일 단위 배열에 첨가된다. 핵산종 혼합물이 테스트될 때 표지된 프로브의 혼합물이 더 중요하다. 핵산종의 복잡한 혼합물 예는 세포 또는 조직에 있는 mRNA이다.If the unit array comprises one or more immobilized probes positive for a given nucleic acid species (as separate spots or within the same spot) all labeled probes are mixed and added to the same unit array. Mixtures of labeled probes are more important when the nucleic acid species mixture is tested. An example of a complex mixture of nucleic acid species is mRNA in a cell or tissue.
본 발명의 한 구체예에 따르면 고정된 프로브의 단위 배열은 모든 가능한 고정된 프로브가 소량의 표지된 프로브의 혼합물과 함께 사용할 수 있도록 한다. 표지된 프로브의 더 복잡한 혼합물은 멀티플렉스 라벨링 스킴의 경우에 사용될 수 있다. 선호되는 멀티플렉싱 방법은 질량 스펙트로스코피에 의해 분리될 수 있는 상이한 형광 염료나 분자 태그를 사용할 수 있다.According to one embodiment of the invention the unit arrangement of immobilized probes allows all possible immobilized probes to be used with a mixture of small amounts of labeled probes. More complex mixtures of labeled probes can be used in the case of multiplex labeling schemes. Preferred multiplexing methods may use different fluorescent dyes or molecular tags that can be separated by mass spectroscopy.
혹은, 많은 핵산서열에 빈번히 교잡하는 비교적 짧은 고정된 프로브가 선택될 수 있다. 이러한 짧은 프로브는 적어도 하나의 표지된 프로브가 각 고정된 프로브에 대응하도록 제조될 수 있는 표지된 프로브 혼합물과 조합으로 사용된다. 선호되는 혼합물은 표지된 프로브의 어느것도 하나 이상의 고정된 프로브에 대응하지 않은 것이다.Alternatively, relatively short fixed probes can be selected that frequently hybridize to many nucleic acid sequences. Such short probes are used in combination with labeled probe mixtures in which at least one labeled probe can be prepared to correspond to each immobilized probe. Preferred mixtures are none of the labeled probes corresponding to one or more immobilized probes.
실시예 27: HIV 바이러스의 세그멘트와 모든 가능한 10-mer의 반응Example 27 Reaction of Segments of HIV Virus with All Possible 10-mers
포맷 Ⅲ SBH에서 배열이 모든 가능한 결합된 5-mer(1024의 가능한 펜타머) 나일론막상에서 발생된다. 결합된 펜타머 올리고누클레오티드가 5'-TTTTTT-NNN-3' (N = A, C, G, T 이고 이 단계에서 동일한 몰량의 4개의 염기가 첨가된다)의 5' 테일로 합성된다. 이 올리고누클레오티드는 정확히 나일론막에 스포팅되고 건조되고 건조된 스포트를 UV 광으로 처리하여 고정한다. 제곱 나노미터당 최대 18 올리고누클레오티드의 밀도가 수득된다. UV처리후 나일론 막을 60-80℃에서 세제함유 버퍼로 처리한다. 올리고누클레오티드 스포트를 10 ×10 스포트 소배열에 배치하고 각 배열은 64개의 펜타머 스포트와 36개의 제어 스포트를 가진다. 16 소배열은 모든 가능한 펜타머를 포함한 1024 펜타머를 제공한다.In format III SBH arrangement occurs on all possible bonded 5-mer (1024 possible pentamers) nylon membranes. Bound pentameric oligonucleotides are synthesized with 5 'tails of 5'-TTTTTT-NNN-3' (N = A, C, G, T and equal molar amounts of 4 bases added at this stage). This oligonucleotide is spotted on the nylon membrane, fixed and dried by treating the dried spot with UV light. A density of up to 18 oligonucleotides per square nanometer is obtained. After UV treatment the nylon membrane is treated with detergent-containing buffer at 60-80 ° C. Oligonucleotide spots are placed in 10 × 10 spot subarrays and each array has 64 pentamer spots and 36 control spots. The 16 subarrays provide 1024 pentamers, including all possible pentamers.
배열내 소배열이 소수성 스트립과 같은 물리적 장벽에 의해 서로 분리되고 인접 소배열로 인한 오염없이 각 소배열이 샘플에 교잡될 수 있다. 한 구체예에서, 소수성 스트립이 적절한 용매에든 실리콘 용액(예, 가정용 실리콘 접착제 및 밀봉페이스트)으로 제조된다. 이 실리콘 그리이스 용액이 소배열 사이에 적용되어 용매 증발후 셀을 분리하는 소수성 스트립으로 작용하는 라인을 형성한다.The subarrays in the array are separated from each other by physical barriers such as hydrophobic strips and each subarray can be hybridized to the sample without contamination due to adjacent subarrays. In one embodiment, the hydrophobic strip is made of a silicone solution (eg, household silicone adhesive and sealing paste) in a suitable solvent. This silicone grease solution is applied between small arrays to form a line that acts as a hydrophobic strip separating the cells after solvent evaporation.
이 포맷 Ⅲ에서 5'-NN-3'(N = A, C, G, T)의 3' 테일로 유리(결합안된) 또는 용액 펜타머가 합성된다. 유리 펜타머와 결합된 펜타머는 조합되어서 20kb 미만의 DNA 서열을 서열화하는 모든 가능한 10-mer를 생성한다. 이중쇄 DNA의 20kb가 40kb의 단일쇄 DNA로 변성된다. 40kb의 ss DNA는 모든 가능한 10-mer의 4%까지 교잡한다. 이렇게 낮은 10-mer 결합 빈도와 타겟 서열은 서열 정보 손실없이 각 소배열 처리용 자유 또는 용액 펜타머를 모을 수 있게 한다. 한 구체예에서 16개의 프로브가 각 소배열에 대해 모아지고 모든 가능한 펜타머가 자유 펜타머의 64 푸울에 나타난다. 따라서 모든 가능한 10-mer가 1024 소배열(각 자유 펜타머 푸울에 대해 16 소배열)을 사용하여 DNA 샘플에 대해 프로빙된다.In this format III free (unbound) or solution pentamers are synthesized with 3 'tails of 5'-NN-3' (N = A, C, G, T). Pentamers bound with free pentamers combine to produce all possible 10-mers that sequence DNA sequences of less than 20 kb. 20kb of double stranded DNA is denatured to 40kb of single stranded DNA. 40kb of ss DNA hybridizes up to 4% of all possible 10-mers. This low 10-mer binding frequency and target sequence allows the collection of free or solution pentamers for each subarray treatment without loss of sequence information. In one embodiment 16 probes are collected for each subarray and all possible pentamers appear in 64 pools of free pentamers. Thus all possible 10-mers are probed for DNA samples using 1024 subarrays (16 subarrays for each free pentamer pool).
이 구체예에서 타겟 DNA는 HIV 바이러스의 2개의 600bp 세그멘트를 나타낸다. 600bp 세그멘트는 60개의 중첩 30-mer 푸울에 의해 표시된다(30-mer는 인접 30-mer를 20 누클레오티드만큼 중첩한다). 30-mer 푸울은 처리된 타겟 DNA를 모방하여서 타겟 DNA를 전단, 소화하여서 매우 적은 단편의 랜덤 푸울을 발생시킨다.In this embodiment the target DNA represents two 600 bp segments of HIV virus. The 600 bp segment is represented by 60 overlapping 30-mer pools (30-mer overlap by 20 nucleotides of adjacent 30-mers). The 30-mer pool mimics the treated target DNA, shearing and digesting the target DNA, resulting in very few fragments of random pools.
앞선 포맷 Ⅲ에서 기술된대로 자유 펜타머는 방사능 동위원소, 비오틴, 형광염료를 써서 표지된다. 표지된 자유 펜타머는 타겟 DNA에 결합된 펜타머와 함께 교잡되고 연결된다. 선호되는 구체예에서 300-1000 단위의 리가아제가 반응에 첨가된다. 교잡 조건은 이전 실시예와 유사하다. 리게이션 반응 및 타겟 DNA와 과잉 자유 프로브 제거후 배열을 분석하여 표지된 프로브의 위치를 결정한다.Free pentamers are labeled with radioactive isotopes, biotin, and fluorescent dyes, as described earlier in Format III. Labeled free pentamers are hybridized and linked with pentamers bound to the target DNA. In a preferred embodiment 300-1000 units of ligase are added to the reaction. Hybridization conditions are similar to the previous embodiment. After the ligation reaction and removal of the target DNA and excess free probe, the sequence is analyzed to determine the position of the labeled probe.
타겟의 DNA 서열과 자유 및 결합 펜타머의 지식으로 각 소배열에서 결합된 펜타머가 표지된 자유 펜타머에 연결됨을 알 수 있다. 예측된 도트중 20개에서 나오는 신호가 손실되고 20개의 새로운 신호가 타겟 DNA 변화에 대해서 예측된 서열로 부터 수득된다. 10개의 새로운 도트의 결합된 펜타머의 중첩 서열은 새로운 도트에 결합되는 자유 표지된 펜타머를 식별한다.The DNA sequence of the target and the knowledge of the free and bound pentamers reveal that the bound pentamers in each subarray are linked to the labeled free pentamers. The signal from 20 of the predicted dots is lost and 20 new signals are obtained from the predicted sequence for the target DNA change. The overlapping sequence of bound pentamers of ten new dots identifies free labeled pentamers that are bound to the new dots.
자유, 표지된 펜타머 배열 및 푸울을 사용하여 테스트 HIV DNA 서열이 모든 가능한 10-mer를 써서 프로빙된다. 이러한 포맷 Ⅲ 방법을 사용하여 테스트된 세그멘트의 "야생형" 서열을 식별하고 세그멘트에 오입된 서열 "돌연변이 유발인자"를 확인하였다.Test HIV DNA sequences are probed using all possible 10-mers using free, labeled pentamer sequences and pools. This Format III method was used to identify the "wild-type" sequence of the segment tested and to identify the sequence "mutant inducer" incorporated into the segment.
실시예 28: 반복 DNA 서열 서열화Example 28 Repeat DNA Sequence Sequencing
한 구체예에서 타겟 DNA내 반복 DNA 서열은 변형 포맷 Ⅲ 방법에서 "스페이서 올리고누클레오티드"를 써서 서열화된다. 가변적 길이의 반복 DNA 서열의 스페이서 올리고누클레오티드(반복 서열은 제 1 SBH 실시로 확인된다)가 제 1 인접 올리고누클레오티드와 스페이서의 다른 면을 연결하는 제 2 올리고누클레오티드와 함께 타겟 DNA에 교잡된다. 반복 DNA 세그멘트의 길이에 일치하는 스페이서가 타겟에 교잡될 때 두 개의 인접 올리고누클레오티드는 스페이서에 연결된다. 제 1 올리고누클레오티드가 기질에 고정되고 제 2 가능한 올리고누클레오티드가 표지될 경우에 적절한 길이의 스페이서가 타겟 DNA에 교잡될 때 표지된 제 2 올리고누클레오티드를 포함한 결합된 연결 생성물이 형성된다.In one embodiment the repeat DNA sequence in the target DNA is sequenced using “spacer oligonucleotides” in a modified Format III method. Spacer oligonucleotides of variable length repeating DNA sequences (repeated sequences identified by the first SBH implementation) are hybridized to the target DNA along with the first oligonucleotide and the second oligonucleotide connecting the other side of the spacer. Two adjacent oligonucleotides are linked to the spacer when a spacer matching the length of the repeating DNA segment is hybridized to the target. When the first oligonucleotide is immobilized on the substrate and the second possible oligonucleotide is labeled, a bound linkage product comprising a labeled second oligonucleotide is formed when the spacer of the appropriate length is hybridized to the target DNA.
실시예 29: 포맷 Ⅲ SBH에 의한 분지점 서열화Example 29 Branch Point Sequencing by Format III SBH
제 3 올리고누클레오티드와 변형된 포맷 Ⅲ 방법을 사용하여 타겟 DNA내 분지점이 서열화된다. 제 1 SBH 실시후 서열이 수집될 때 여러 분지점이 식별될 수 있다. 이것은 공지서열중 하나와 중첩되어 분지점이 되게 하는 올리고누클레오티드를 교잡하고 이어서 표지되고 분지점으로 부터 나온 서열중 하나에 대응하는 추가 올리고누클레오티드를 타겟에 교잡함으로써 해결된다. 적절한 올리고누클레오티드가 타겟 DNA에 교잡될 때 표지된 올리고누클레오티드가 다른 것에 연결될 수 있다. 한 구체예에서 분지점으로 부터 1 내지 수개의 누클레오티드만큼 오프셋된 제 1 올리고누클레오티드가 선택되고 제 1 및 분지점 서열로 부터 판독되는 제 2 올리고누클레오티드가 선택되고 1 내지 수개의 누클레오티드만큼 분지점 서열과 중첩된 모든 가능한 분지점에 대응하는 제 3 올리고누클레오티드가 선택된다. 이들 올리고누클레오티드는 타겟 DNA에 교잡되고 적절한 분지서열을 갖는 제 3 올리고누클레오티드가 제 1 및 제 2 올리고누클레오티드와 연결 생성물을 생성한다.Branching points in the target DNA are sequenced using a third oligonucleotide and a modified Format III method. Several branches can be identified when the sequence is collected after the first SBH run. This is solved by hybridizing oligonucleotides overlapping one of the known sequences to the branching point, and then hybridizing additional oligonucleotides to the target that correspond to one of the sequences labeled and derived from the branching point. Labeled oligonucleotides can be linked to one another when appropriate oligonucleotides are hybridized to the target DNA. In one embodiment a second oligonucleotide is selected that is offset by one to several nucleotides from the branch point and a second oligonucleotide is selected that is read from the first and branch point sequences and selected by one to several nucleotides, A third oligonucleotide is selected that corresponds to all possible branches of overlap. These oligonucleotides hybridize to the target DNA and have a third oligonucleotide with the appropriate branching sequence to form a linkage product with the first and second oligonucleotides.
실시예 30: 타겟 핵산 분석용 멀티플렉싱 프로브Example 30: Multiplexing Probes for Target Nucleic Acid Analysis
이 실시예에서 한 세트의 각 프로브가 세트내 다른 프로브와 구별될 수 있도록 프로브 세트가 다양한 라벨로 표지된다. 따라서, 프로브 정보 손실없이 단일 교잡반응에서 프로브 세트가 타겟 핵산과 접촉될 수 있다. 한 구체예에서 상이한 라벨은 상이한 방사능동위원소, 상이한 형광라벨 또는 EML이다. 이들 프로브 세트가 포맷 Ⅰ, Ⅱ, Ⅲ SBH에 사용될 수 있다.In this embodiment, the probe set is labeled with various labels so that each probe in the set can be distinguished from other probes in the set. Thus, a probe set can be contacted with a target nucleic acid in a single hybridization without loss of probe information. In one embodiment the different labels are different radioisotopes, different fluorescent labels or EML. These probe sets can be used for formats I, II and III SBH.
포맷 Ⅰ SBH에서 상이하게 표지된 프로브 세트가 완벽한 일치와 하나의 염기쌍 불일치를 구별하는 조건하에서 기질에 고정된 타겟 핵산에 교잡된다. 타겟 핵산에 결합하는 특정 프로브가 다양한 라벨에 의해 식별되고 이러한 결합 정보로 부터 완벽한 일치가 측정된다.Differently labeled probe sets in Format I SBH are hybridized to a target nucleic acid immobilized on a substrate under conditions that distinguish between perfect match and one base pair mismatch. Specific probes that bind to the target nucleic acid are identified by various labels and a perfect match is determined from this binding information.
포맷 Ⅱ SBH에서 타겟 핵산이 상이한 프로브로 표지되고 프로브 배열에 교잡된다. 프로브에 결합하는 특이적 타겟 핵산이 상이한 라벨에 의해 식별되고 결합정보로 부터 완벽한 일치가 결정된다.In format II SBH target nucleic acids are labeled with different probes and hybridized to the probe array. Specific target nucleic acids that bind to the probe are identified by different labels and a perfect match is determined from the binding information.
포맷 Ⅲ SBH에서 상이하게 표지된 프로브와 고정된 프로브 세트가 하나의 염기쌍이 불일치된 것과 완벽한 일치를 구별하는 조건하에서 타겟 핵산에 교잡된다. 타겟상에서 고정된 프로브에 인접한 표지된 프로브가 고정된 프로브에 결합되고 생성물이 탐지되고 상이한 라벨에 의해 구별된다.In Format III SBH, differently labeled probes and a fixed set of probes are hybridized to the target nucleic acid under conditions that distinguish a perfect match from a mismatch of one base pair. Labeled probes adjacent to the immobilized probe on the target are bound to the immobilized probe and the product is detected and distinguished by different labels.
한 구체예에서, 상이한 라벨은 EML이며 전자 포착 질량 스펙트로메트리(EC-MS)에 의해 탐지될 수 있다. 다양한 골격 분자로 부터 EML이 제조되며 방향족 골격이 특히 선호된다(Xu, J. Chromatog. 764:95-102 (1977). EML은 가역적이고 안정한 방식으로 프로브에 부착되고 프로브가 타겟 핵산에 교잡된후 프로브로 부터 EML이 제거되고 표준 EC-MS에 의해 식별된다(EC-MS는 가스크로마토그래피-질량 스펙트로미터에 의해 수행될 수 있다).In one embodiment, the different label is EML and can be detected by electron capture mass spectrometry (EC-MS). EMLs are prepared from various skeletal molecules and aromatic backbones are particularly preferred (Xu, J. Chromatog. 764: 95-102 (1977). EMLs are attached to the probes in a reversible and stable manner and after the probes are hybridized to the target nucleic acid EML is removed from the probe and identified by standard EC-MS (EC-MS can be performed by gas chromatography-mass spectrometer).
실시예 31: 저빈도 타겟 핵산 탐지Example 31 Detection of Low Frequency Target Nucleic Acids
포맷 Ⅲ SBH는 단일 핵산이 차이가 나는 유사서열의 1 내지 99 부분에서 샘플에 존재하는 서열을 식별하는 충분한 판별력을 가진다. 따라서 포맷 Ⅲ은 매우 낮은 농도의 핵산 샘플(예, 혈액샘플)에 존재하는 핵산을 식별하는데 사용될 수 있다.Format III SBH has sufficient discrimination to identify the sequences present in the sample in the 1-99 portions of the analogous sequences that differ in a single nucleic acid. Thus, Format III can be used to identify nucleic acids present in very low concentrations of nucleic acid samples (eg blood samples).
한 구체예에서, 두 개의 서열은 낭포성섬유증에 대한 것이며 서열은 3개의 누클레오티드 제거만큼 서로 다르다. 두 개의 서열에 대한 프로브는 다음과 같다: 기질에 고정된 야생종으로 부터 삭제를 구별하는 프로브, 둘다에 공통적인 표지된 프로브. 이러한 타겟과 프로브를 사용하여 야생종의 99분의 1로 존재할 때 포맷 Ⅲ SBH를 써서 삭제 돌연변이 유발요인이 탐지될 수 있다.In one embodiment, the two sequences are for cystic fibrosis and the sequences are different from each other by three nucleotide removals. The probes for the two sequences are as follows: a probe that distinguishes deletions from wild species immobilized on a substrate, labeled probes common to both. Using these targets and probes, deletion mutagenesis can be detected using format III SBH when present in one-hundredth of wild species.
실시예 32: 타겟 핵산 분석방법 및 폴라로이드 장치Example 32: Target Nucleic Acid Assay and Polaroid Apparatus
핵산 분석 장치는 두 개의 핵산 배열과 혼합이 요구될 때까지 두 개의 핵산 배열이 혼합되는 것을 방지하는 보조재료를 써서 구성될 수 있다. 장치의 배열은 나일론막, 니트로셀룰로오스막 또는 위에서 발표된 다른 재료를 포함한 다양한 기질에 의해 지탱될 수 있다. 선호되는 구체예에서 기질중 하나는 소수성 스트립이나 겔 또는 스폰지를 포함할 수 있는 우물을 갖는 적당한 지지재료에 의해 섹터로 분리된 부재이다. 이 구체예에서, 프로브는 막의 섹터상이나 우물, 겔 또는 스폰지에 놓이고 용액(타겟 핵산이 존재할 수 있는)이 막 또는 우물에 첨가되어서 프로브가 용해된다. 용해된 프로브를 갖는 용액은 이후에 제 2 핵산배열에 접촉된다. 핵산은 올리고누클레오티드 프로브 또는 타겟 핵산일 수 있으며 프로브 또는 타겟 핵산이 라벨링될 수 있다. 핵산은 방사능동위원소, 형광성 라벨 또는 전기영동 라벨과 같이 당해분야에 사용된 라벨로 표지될 수 있다.The nucleic acid analysis device may be constructed using auxiliary materials that prevent the two nucleic acid sequences from being mixed until mixing with the two nucleic acid sequences is required. The arrangement of the device can be supported by various substrates, including nylon membranes, nitrocellulose membranes or other materials disclosed above. In a preferred embodiment one of the substrates is a sector separated member by a suitable support material having wells which may comprise hydrophobic strips or gels or sponges. In this embodiment, the probe is placed on a sector of the membrane or in a well, gel or sponge and a solution (where target nucleic acid may be present) is added to the membrane or well to dissolve the probe. The solution with the dissolved probe is then contacted with the second nucleic acid sequence. The nucleic acid may be an oligonucleotide probe or target nucleic acid and the probe or target nucleic acid may be labeled. Nucleic acids can be labeled with labels used in the art, such as radioisotopes, fluorescent labels or electrophoretic labels.
핵산 혼합을 방지하는 재료는 재료가 제거될 때 두 개의 핵산 배열이 혼합되도록 하는 방식으로 두 배열 사이에 배치될 수 있다. 이러한 재료는 쉬이트, 막 또는 기타 장벽 형태이며 핵산의 혼합을 방지하는 물질로 구성될 수 있다.Materials that prevent nucleic acid mixing can be placed between the two arrays in such a way that the two nucleic acid arrays are mixed when the material is removed. Such materials may be in the form of sheets, membranes or other barriers and may consist of substances which prevent mixing of nucleic acids.
이러한 장치가 다음과 같이 포맷 Ⅰ SBH에 사용될 수 있다: 장치의 제 1 배열은 기질에 고정되는 타겟 핵산이고 제 2 배열은 라벨링되고 제 1 배열의 타겟 핵산에 반응하도록 제거될 수 있는 핵산 프로브를 가진다. 두 개의 배열은 프로브가 타겟핵산과 접촉하는 것을 방지하는 물질로된 쉬이트로 분리되며 이 쉬이트가 제거될 때 프로브는 타겟에 반응한다. 적절한 배양 및 세척단계후 형성된 프로브가 타겟과 완전 일치하는지 판정하기 위해서 타겟 배열이 "판독"될 수 있다. 이러한 판독은 자동화되거나 수동으로 (예컨대 오토라이동그램을 눈으로 확인) 행해질 수 있다. 포맷 Ⅲ SBH에서 타겟이 라벨링되고 프로브가 고정된 점을 제외하면 이어지는 절차가 위에서 기술된 절차와 유사할 것이다.Such devices can be used in Format I SBH as follows: The first array of devices is a target nucleic acid immobilized on a substrate and the second array has a nucleic acid probe that can be labeled and removed to react to the target nucleic acid of the first array. . The two arrays are separated into sheets of material that prevent the probe from contacting the target nucleic acid and when the sheet is removed the probe responds to the target. The target array can be “read” to determine if the probe formed after the appropriate incubation and washing steps is fully consistent with the target. Such reading can be done automatically or manually (eg visually checking the autogram). The following procedure will be similar to the procedure described above, except that the target is labeled in the Format III SBH and the probe is fixed.
이 장치는 다음과 같이 포맷 Ⅲ SBH에서 사용될 수 있다: 두 개의 핵산 프로브 배열이 형성되고 핵산 프로브가 라벨링되고 배열중 하나는 기질에 부착된다. 두 배열은 프로브 혼합을 방지하는 쉬이트로 분리된다. 타겟 핵산을 첨가하고 쉬이트를 제거하여 프로브가 서로 및 타겟과 혼합되게 함으로써 포맷 Ⅱ 반응이 개시된다. 타겟상의 인접한 사이트에 결합한 프로브는 염기 축적 상호작용이나 골격에 공유결합시킴으로써 서로 결합되고 인접한 사이트에서 타겟에 결합된 프로브를 판정하기 위해서 결과가 판독된다. 한 세트의 프로브가 기질에 고정될 때 고정된 배열이 판독되어서 다른 배열에서 나온 프로브중 어느 것이 고정된 프로브와 결합되는가를 결정한다. 이러한 방법에서 판독이 자동화(ELISA 판독기)되거나 수동으로 행해진다(오토라디오그램을 눈으로 확인).This device can be used in Format III SBH as follows: Two nucleic acid probe arrays are formed, nucleic acid probes are labeled and one of the arrays is attached to a substrate. The two arrays are separated into sheets to prevent probe mixing. The format II reaction is initiated by adding the target nucleic acid and removing the sheet to allow the probes to mix with each other and the target. Probes bound to adjacent sites on the target are bound to each other by covalent bonds to base accumulation interactions or backbones and the results are read to determine probes bound to the target at adjacent sites. When one set of probes is immobilized on a substrate, the immobilized array is read to determine which of the probes from the other array is associated with the immobilized probe. In this way, the reading is either automated (ELISA reader) or manually (visually checking the autoradiogram).
실시예 33; 프로브의 3차원 배열Example 33; 3-D array of probes
적절한 구체예에서, 올리고뉴클레오티드 프로브는 3차원 배열에 고정된다. 3차원 배열은 다수의 층으로 구성되고, 각 층은 다른 층과는 떨어져 있고, 별도로 분석된다. 3차원 배열은 여러 가지 형태를 취하는데, 예를 들면, 배열은 디프레션내에 상이한 깊이로 위치한 프로브와 다중 디프레션을 가지는 기질에 배치된다(각 수준은 디프레션내에 유사한 깊이를 가지는 기질에 배치된다) 또는 배열은 디프레션 바닥에 또는 디프세션을 분리하는 피크에 또는 피크 및 디프레션이 복합된 위치한 프로브와 상이한 깊이의 디프레션을 가지는 기질에 배치된다; 또는 3차원 배열을 만들기위해 층을 이룬 다중 쉬트로 구성된 기질에 배치된다.In a suitable embodiment, the oligonucleotide probe is immobilized in a three dimensional array. The three-dimensional array consists of a plurality of layers, each layer separated from the other layers and analyzed separately. Three-dimensional arrays take many forms, for example, the array is placed on a substrate having multiple depressions and probes located at different depths in the depression (each level is placed on a substrate having a similar depth in the depression) or arrangement Is placed at the bottom of the depression or at a peak that separates the depression or on a substrate having a depth of depression different from the located probe where the peak and depression are combined; Or placed on a substrate composed of multiple layers layered to create a three-dimensional array.
3차원 배열을 합성하는 물질은 당분야에 공지된 것으로써, 프로브 배열용 서포트에 적합하다고 언급한 물질이 포함된다. 또한, 올리고뉴클레오티드 프로브를 서포트할 수 있는 다른 적절한 물질, 적절하게는 유연성 있는 물질이 기질로 이용된다.Materials for synthesizing three-dimensional arrays are known in the art and include those mentioned as suitable for support for probe arrays. In addition, other suitable materials capable of supporting oligonucleotide probes, suitably flexible materials, are used as the substrate.
실시예 33; cDNA 클론을 모으기 위한 신호 과정Example 33; Signaling process to collect cDNA clones
표준 PCR, SBH 서열 신호 분석 및 Sanger 서열화 기술을 이용하여 cDNA 라이브러리에서 별개 핵산 서열 다수를 수득하였다. 라이브러리 삽입체는 삽입체에 연결된 벡터 서열에 특이적인 프라이머를 이용하여 PCR에Ekfk 증폭하였다. 이들 샘플을 나일론 막에 스팟하고, 적정수의 올리고뉴클레오티드 프로브로 신호를 제공하고, 양성 결합 프로브의 강도는 주어진 서열 신호로 측정하였다. 클론은 유사한 또는 동일한 서열 신호 군으로 분류하고, 단일 클론은 각 겔 서열군에서 선택된다. 증폭된 삽입체의 5' 서열을 전형적인 Sanger 서열 프로토콜을 이용하여 역 M13 서열화 프라이머를 이용하여 유추한다. PCR 생성물을 정제하고, 형광 염료 종료 사이클 서열화 반응을 한다. 단일 통과 겔 서열화는 377 Applied Biosystems(ABI) sequencer를 이용한다. 이 방법에 의해 선택되어 서열화된 대부분 클론은 서로 다른 서열을 가지는데, 극소수만이 동일한 서열을 가진다.Multiple distinct nucleic acid sequences were obtained from the cDNA library using standard PCR, SBH sequence signal analysis and Sanger sequencing techniques. The library insert was amplified by Ekfk in PCR using primers specific for the vector sequence linked to the insert. These samples were spotted on nylon membranes, provided signals with the appropriate number of oligonucleotide probes, and the strength of the positive binding probes measured with the given sequence signal. Clones are classified into similar or identical sequence signal groups, and single clones are selected from each gel sequence group. The 5 'sequence of the amplified insert is inferred using reverse M13 sequencing primers using a typical Sanger sequence protocol. The PCR product is purified and subjected to fluorescent dye termination cycle sequencing reactions. Single pass gel sequencing uses a 377 Applied Biosystems (ABI) sequencer. Most clones selected and sequenced by this method have different sequences, with very few having the same sequence.
실시예 35; 칩의 다량 생산Example 35; Mass production of chips
적절한 구체예에서,, 다량의 프로브 배열을 만드는 장치는 잉크-젯 침착 장치 가령, 마이크로드롭 도징 헤드가 결합된 회전 드럼 또는 판; 안라드 간트리와 같은 적절한 로봇 시스템으로 구성된다. 장치의 특정 예는 도 1-3에서 설명한다.In a suitable embodiment, the apparatus for making a large amount of probe arrangement comprises an ink-jet deposition apparatus such as a rotating drum or plate with a microdrop dosing head coupled thereto; It consists of a suitable robotic system such as Anrad Gantry. Specific examples of the apparatus are described in FIGS. 1-3.
장치는 적절한 기질이 고정되는 실린더(1)로 구성된다. 기질은 프로브 배열을 만드는데 적합한 전술한 임의 물질이 된다. 적절한 구체예에서, 기질은 유연성있는 물질이 되고, 배열은 기질상에서 바로 만들어진다. 또 다른 구체에에서는 유연성 기질은 실린더에 고정되고, 개별 칩은 기질에 고정된다. 배열은 각 개별 칩에서 만들어진다.The device consists of a cylinder 1 to which a suitable substrate is fixed. The substrate will be any of the materials described above suitable for making probe arrays. In a suitable embodiment, the substrate is a flexible material and the arrangement is made directly on the substrate. In another embodiment, the flexible substrate is fixed to the cylinder and the individual chips are fixed to the substrate. Arrays are made from each individual chip.
적절한 구체예에서, 물리적인 장벽이 기질 또는 칩에 제공되는데, 이 장벽이 웰 배열이 된다. 물리적인 장벽은 기질 또는 칩에 장치를 이용하여 제공하거나 또는 물리적인 장벽은 실린더에 고정시키기 전에 기질 또는 칩에 제공된다. 단일 스팟 올리고뉴클레오티드 프로브는 각 웰에 위치되고, 이때 개별 웰에 위치되는 프로브는 동일한 서열을 가지거나 또는 개별 웰에 스팟된 프로브는 다른 서열을 가진다. 좀더 적절한 구체예에서, 배열에서 각 개별 웰에 스팟된 프로브는 배열의 다른 웰에 스팟된 프로브와는 다르다. 다중 웰로 구서오딘 서열화 칩을 이들 배열로부터 조립한다.In a suitable embodiment, a physical barrier is provided to the substrate or chip, which barrier is the well arrangement. The physical barrier is provided by the device to the substrate or chip, or the physical barrier is provided to the substrate or chip prior to fixing to the cylinder. Single spot oligonucleotide probes are located in each well, where probes located in individual wells have the same sequence or probes that are spotted in individual wells have different sequences. In a more suitable embodiment, probes spotted in each individual well in an array are different from probes spotted in other wells of the array. Guseoodin sequencing chips are assembled from these arrays into multiple wells.
기질 및 칩이 실린더(1)에 고정된 후에, 모터(나타내지 않음)를 이용하여 실린더를 회전시킨다. 실린더의 회전 속도는 당분야에 공지된 임의 방법으로 정확하게 결정하는데, 예를 들면, 실린더를 회전시키는 고정된 광학적인 센스 및 빛 소스를 이용한다. 분배 장치(3)는 암(2)을 따라 이동하여, 분배 팁(8)을 통하여 프로브 또는 다른 시약을 기질 또는 칩상에 정확한 위치로 이동시키는데, 이때는 당분야에 공지된 방법을 이용하여 상기에서 계산된 정확한 회전 속도를 이용하게 된다. 분배 장치는 공급 라인(7)을 통하여 저장기(6)로부터 프로브 또는 시약을 제공받는다. 저장기(6)는 배열을 만드는데 필요한 모든 프로브 및 다른 시약을 가지고 있다.After the substrate and the chips are fixed to the cylinder 1, the cylinder is rotated using a motor (not shown). The rotational speed of the cylinder is accurately determined by any method known in the art, for example using a fixed optical sense and a light source that rotates the cylinder. The dispensing device 3 moves along the arm 2 to move the probe or other reagent through the dispensing tip 8 to the correct position on the substrate or chip, as described above using methods known in the art. To use the correct rotational speed. The dispensing device receives a probe or reagent from the reservoir 6 via the supply line 7. Reservoir 6 has all the probes and other reagents needed to make an array.
도 3에서는 분배 장치를 설명한 것이다. 분배 장치는 한 개 또는 다수의 분배 팁(14&8)dmf 가진다. 각 분배 팁에는 샘플 라인(10)을 통하여 프로브 또는 다른 시약을 제공받는 샘플 웰(13)이 몸체(12)내에 있다. 압력 라인(11)은 챔버(9)에 psi 압력을 가하여, 분배 팁(14, 8)을 통하여 프로브 또는 시약을 밀어내도록 한다. 샘플 라인(10), 웰(13), 분배 팁(14, 8)에는 매번 변화사이에 프로브 또는 시약으로 채워져야 한다. 적절한 세척 완충액이 샘플 라인(10) 또는 선택적으로 지정된 세척 라인(나타내지 않음)을 통하여 샘플 웰(13)로 공급되거나 또는 쳄버(9)의 일부 또는 전부에세척 완충액에 채워진다. 그 다음 세척 완충액을 필요에 따라 샘플 웰과 쳄버로부터 빼내는데, 배송 라인(나타내지 않음) 또는 샘플 라인(10) 및 분배 팁(14, 8)dmf 통하여 이루어진다.3 illustrates a dispensing device. The dispensing device has one or multiple dispensing tips 14 & 8 dmf. Each dispensing tip has a sample well 13 in the body 12 that receives a probe or other reagent through the sample line 10. Pressure line 11 applies psi pressure to chamber 9 to force the probe or reagent through the dispensing tips 14, 8. Sample lines 10, wells 13, and dispensing tips 14, 8 must be filled with a probe or reagent between each change. Appropriate wash buffer is supplied to sample well 13 via sample line 10 or optionally designated wash line (not shown) or filled in some or all of chamber 9 in wash buffer. The wash buffer is then withdrawn from the sample wells and chambers as needed, either via delivery line (not shown) or via sample line 10 and dispensing tips 14, 8.
분배 수단이 각 배열 또는 칩에서 적절한 부위로 프로브를 제공할 때, 기질(칩의 유무에 상관없이)을 실린더로부터 제거하고, 새로운 기질을 실린더에 고정시킨다.When the dispensing means provides the probe to the appropriate site in each array or chip, the substrate (with or without chips) is removed from the cylinder and the new substrate is fixed to the cylinder.
실시예 36; 별개 입자에 복합된 프로브를 가지는 표적 핵산의 분석Example 36; Analysis of Target Nucleic Acids Having Probe Complexed to Separate Particles
한 구체예에서, 표적 핵산에는 다수의 별개 입자에 복합된(공유 또는 비-공유) 프로브로 신호를 제공한다. 이와 같은 별개 입자는 물리적인 성질(또는 복합 물리적인 성질)에 기초하여 서로 구별되는데, 물리적인 성질에 의해 구별되는 입자는 상이한 프로브를 가진다. 적절한 구체예에서, 프로브는 공지의 서열 및 길이를 가지는 올리고뉴클레오티드이다. 따라서, 프로브는 별개 입자의 물리적인 성질에 의해 확인된다. 이와 같은 구체예에 적합한 적절한 프로브에는 기존에 설명한 모든 프로브 및 전체 길이의 프로브보다 짧은 정보 센스를 가지는 프로브도 포함된다.In one embodiment, the target nucleic acid is provided with a signal complexed (covalent or non-covalent) to a plurality of separate particles. These separate particles are distinguished from each other based on their physical properties (or complex physical properties), which particles have different probes. In a suitable embodiment, the probe is an oligonucleotide having a known sequence and length. Thus, probes are identified by the physical properties of the discrete particles. Suitable probes suitable for this embodiment also include probes having a shorter information sense than all previously described probes and full length probes.
별개 입자의 물리적인 성질은 당분야에 공지된 임의 성질로 입자들을 세트로 구별하는데 이용된다. 예를 들면, 입자들은 이들의 크기, 형광, 흡수도, 전자장에서 전하, 중량, 염료, 방사능뉴클리드 또는 EMLs에 의해 라벨된 입자등으로 구별할 수 있다. 다른 적절한 라벨에는 라벨된 항체, 화학적 발광물질, 효소 및 라벨된 리간드의 특이적인 결합 쌍으로 작용할 수 있는 항체등에 특이적인 결합 요소로 작용하는 리간드등이 포함된다. 바로 이용할 수 있는 면역검사에 이용되는 다양한 라벨을 이용한다. 다른 라벨에는 항원, 특정한 반응성을 가지는 기, 전기화학적으로 감지가능한 부분등이 포함된다. 또 다른 라벨로는 기존에 설명한 라벨이 포함된다. 이와 같은 라벨 및 성질은 당분야에 공지된 방법으로 정량적으로 측정이 가느안데, 예를 들면, 기존에 설명한 방법등을 이용하고, 입자는 신호 강도, 신호 형태(라벨에 대한 신호 형태 및 강도, 가령, 다른 염료 강도를 입자에 제공하거나 다른 형태의 염료를 제공함)에 기초하여 구별할 수 있다. 적절한 구체예에서, 몇 가지 물리적인 성질이 복합되고, 상이한 성질이 복합되어 입자를 구별할 수 있도록 한다(가령, 10개 크기 및 색깔이 복합되면, 100개 입자를 구별할 수 있다).The physical properties of the discrete particles are used to distinguish the particles into sets with any properties known in the art. For example, the particles can be distinguished by their size, fluorescence, absorbance, charge in the electromagnetic field, weight, dye, radionuclides or particles labeled by EMLs. Other suitable labels include ligands that act as binding elements specific to labeled antibodies, chemiluminescent materials, antibodies that can act as specific binding pairs of enzymes and labeled ligands, and the like. Use a variety of labels used for ready-to-use immunoassays. Other labels include antigens, groups with specific reactivity, electrochemically detectable moieties, and the like. Another label includes a previously described label. Such labels and properties are not quantitatively measured by methods known in the art, for example, using previously described methods, and the particles may be characterized by signal strength, signal type (signal shape and strength for labels, such as , Different dye intensities to the particles or different types of dyes). In a suitable embodiment, several physical properties are combined and different properties are combined to distinguish particles (eg, if 10 sizes and colors are combined, 100 particles can be distinguished).
입자-프로브로 표준 복합 방법을 개발할 수 있는데, 가령, 모든 가능성이 있는 10-mer은 약 2000개 반응 용기를 이용하여 합성할 수 있다. 제 1 세트 1024개 반응을 실시하여, 1024개 상이하게 라벨된 입자에서 모든 가능성이 있는 5-mer을 합성한다. 생성된 프로브-입자 혼합물을 함께 혼합하고, 이들을 또 다른 1024 반응 용기 세트로 나눈다. 제 2 세트 반응을 이들 샘플을 이용하여 실시하여, 입자 풀에 프로브상에서 모든 가능성이 있는 5-mer 연장을 합성한다. 물리적인 성질로 각 프로브의 처음 5개 뉴클레오티드를 확인할 수 있고, 반응 용기로 모든 프로브의 두 번째 5개 뉴클레오티드를 확인할 수 있다. 따라서, 모든 가능성 있는 10-mer은 2048개 반응 용기를 이용하여 합성할 수 있다. 이와 같은 방식을 용이하게 변형하여, 더 큰 범위의 프로브에 대해 모든 가능성이 있는 n-mer을 만들 수 있다.Particle-probes can be used to develop standard complex methods, for example, all possible 10-mers can be synthesized using about 2000 reaction vessels. A first set of 1024 reactions are conducted to synthesize all possible 5-mers from 1024 differently labeled particles. The resulting probe-particle mixtures are mixed together and divided into another 1024 reaction vessel set. A second set of reactions is carried out using these samples to synthesize all possible 5-mer extensions on the probe to the particle pool. Physical properties identify the first five nucleotides of each probe, and reaction vessels identify the second five nucleotides of all probes. Thus, all possible 10-mers can be synthesized using 2048 reaction vessels. By easily modifying this approach, it is possible to make all possible n-mers for a larger range of probes.
적절한 구체예에서, 입자는 입자의 형광 강도에 따라 세트로 분리된다. 각 세트에 있는 입자는 형광 라벨의 밀도를 다양하게 하여 준비하여 입자는 상이한 형광 강도를 가진다. 플로레신의 형광 강도는 1:300 내지 1:300,000(Lockhart et al., 1986) 범위의 농도에 관계하는데, 적절하게는 1:3000 내지 1:300,000 사이에서, 선형 관계가 있다(형광 강도는 약 1-300 범위이상에서 선형이 된다). 선형 범위의 감지에서, 256 세트 입자에 플로레신(e.g., 30-259)을 라벨한다. 256 세트 입자를 이용하면, 상이한 세트 입자에 모든 가능한 4-mer를 부착할 수 있다. 이와 같은 입자를 합하면, 가능성이 있는 모든 4-mer 풀(pool)을 가지게 되고, 각 풀에서 A, G, C, T에 의해 연장되어 가능성이 있는 모든 5-mer을 만들 수 있다. 유사하게, 가능성이 있는 6-mer은 가능성이 있는 모든 4-mer을 가지고, 각 4-mer 풀을 A, G, C, T로 된 16가지 가능성이 있는 두 개 염기 변이 중 하나로 연장되어 만들어질 수 있는데, 예를 들면 7-mer 경우에는 64개 풀, 8-mer 경우에는 256개 풀..)In suitable embodiments, the particles are separated into sets according to the fluorescence intensity of the particles. The particles in each set are prepared with varying densities of fluorescent labels so that the particles have different fluorescence intensities. The fluorescence intensity of floresin relates to concentrations ranging from 1: 300 to 1: 300,000 (Lockhart et al., 1986), preferably between 1: 3000 and 1: 300,000, with a linear relationship (fluorescence intensity is about 1 Linear over the range -300). In the detection of the linear range, 256 sets of particles are labeled with floresin (e.g., 30-259). With 256 set particles, it is possible to attach all possible 4-mers to different set particles. When these particles are added together, we have all possible 4-mer pools, each extending by A, G, C, and T in each pool to produce all possible 5-mers. Similarly, a probable 6-mer has all the 4-mers likely, and each 4-mer pool is made to extend into one of 16 probable two base variants of A, G, C, and T. For example, 64 pools for 7-mer, 256 pools for 8-mer ..)
5-mer 프로브(네개 풀)를 이용하여 표적 핵산에 신호를 제공한다. 표적 핵산은 또 다른 형광 염료 또는 다른 상이한 라벨(상기에서 설명함)로 라벨을 시킨다. 라벨된 표적은 4개 풀로 혼합하고, 각 풀에 있는 상보적인 프로브가 표적 핵산에 하이브리드된다. 이와 같은 하이브리드 복하베는 당분야에 공지된 방법을 이용하여 감지할 수 있는데, 양성적으로 하이브리드된 프로브는 입자의 형광 강도를 감지하여 확인할 수 있다. 가장 적절한 구체예에서, 프로브-입자 및 표적 핵산 혼합물은 한번에 유동 세포측정계 또는 다른 분리 장치를 통하여 한개 입자에 공급되고, 입자 라벨 및 표적을 측정하여 표적 핵산에 상보적인 프로브를 결정한다.A 5-mer probe (four pools) is used to provide signal to the target nucleic acid. The target nucleic acid is labeled with another fluorescent dye or another different label (described above). The labeled targets are mixed into four pools, and the complementary probes in each pool are hybridized to the target nucleic acid. Such hybrid diphabe can be detected using a method known in the art, the positively hybridized probe can be confirmed by sensing the fluorescence intensity of the particles. In the most suitable embodiment, the probe-particle and target nucleic acid mixture is supplied to one particle at a time through a flow cytometer or other separation device, and the particle label and target are measured to determine the probe complementary to the target nucleic acid.
또 다른 구체예에서, 프로브 세트는 또 다른 형광 염료 또는 다른 라벨(상기에서 설명함)로 라벨하고, 개별 자유 프로브는 각 5-mer 풀(네개 풀)과 혼합하고, 그 다음 혼합물은 표적 핵산과 하이브리드시킨다. 자유 프로브가 5-mer 프로브가 결합된 부위에 인접하는 표적 핵산에 있는 부위에 결합되면(자유 프로브 부위는 결찰되는 5-mer 프로브의 말단에 인접해야 함), 물질을 첨가하여 자유 프로브가 5-mer 프로브에 공유적으로 결합하도록 한다(적절한 물질에 대한 설명을 참고). 그 다음, 공지의 방법을 이용하여, 입자를 검사하여, 자유 프로브에 공유적으로 결합된 입자 즉, 자유 프로브 라벨을 가지는 입자를 측정하는데, 5-mer 프로브는 입자의 형광 강도로 확인된다. 가장 적절한 구체예에서, 프로브-입자, 자유 프로브, 표적 핵산 혼합물은 유동 세포측정계를 통하여 한번에 한개 입자에 공급되고, 입자 라벨 및 자유 프로브 라벨을 측정하여 표적 핵산에 상보적인 프로브를 결정한다.In another embodiment, the probe set is labeled with another fluorescent dye or another label (described above), individual free probes are mixed with each 5-mer pool (four pools), and then the mixture is mixed with the target nucleic acid. Hybrid. When the free probe is bound to a site in the target nucleic acid adjacent to the site to which the 5-mer probe is bound (the free probe site must be adjacent to the end of the ligation 5-mer probe), the substance is added to the free probe covalently bind to the mer probe (see the description of the appropriate material). The particles are then inspected using known methods to measure particles covalently bound to the free probe, ie, particles with free probe labels, wherein the 5-mer probe is identified by the fluorescence intensity of the particle. In the most suitable embodiment, the probe-particle, free probe, target nucleic acid mixture is supplied to one particle at a time through a flow cytometer and the particle label and free probe label are measured to determine the probe complementary to the target nucleic acid.
적절한 구체예에서, 한개 장치에는 프로브-입자 복합체를 가지는 표적 핵산 분석을 위해 모든 또는 대부분의 조정 수단을 보유한다. 장치에는 한가지 이상의 시약 쳄버를 가지는데, 이 쳄버에서 완충액 및 라벨된 표적 핵산이 완전하게 혼합된다(표적 핵산은 손으로 또는 자동적으로 첨가될 수 있다). 혼합물을 시약 쳄버로부터 다수의 반응 쳄버로 나누고, 각 반응 쳄버에는 프로브-입자 복합체 풀을 가진다. 프로브-입자 및 표적 핵산은 상보적인 프로브가 표적 핵산에 결합을 할 수 있는 조건하에서 반응한다. 과량의 표적 핵산 가령, 결합안된 것은 반응 쳄버에서 제거하고(세척 등을 이용), 표적 핵산에 결합된 프로브는 입자를 가지는 표적 핵산 라벨을 이용하여 확인되고, 프로브는 입자의 물리적인 성질로 확인된다. 적절한 구체예에서, 과량의 표적을 제거한 후에, 입자는 반응 쳄버에서 감지 장치로 이어진 체널을 통하여 단일 전송으로 이동된다. 단일 입자가 감지 장치로 이용될 때, 이들은 표적 핵산과 입자의 물리적인 성질을 측정한다. 또 다른 적절한 구체예에서, 과량의 표적을 제거하기 전 또는 후에, 입자는 크기(가령, 압출 크로마토그래피), 전하(가령, 이온 교환 크로마토그래피), 밀도-중량 등의 이들의 물리적인 성질 한가지 또는 복합 성질에 따라 세트로 분별한다. 이와 같이 분별된 입자는 감지 장치에 의해 검사한다.In a suitable embodiment, one device retains all or most of the adjustment means for target nucleic acid analysis with probe-particle complexes. The device has one or more reagent chambers in which the buffer and labeled target nucleic acid are thoroughly mixed (target nucleic acid can be added by hand or automatically). The mixture is divided from reagent chambers into a number of reaction chambers, each having a probe-particle complex pool. The probe-particle and the target nucleic acid react under conditions that allow the complementary probe to bind to the target nucleic acid. Excess target nucleic acid, such as unbound, is removed from the reaction chamber (using washing, etc.), the probe bound to the target nucleic acid is identified using a target nucleic acid label with particles, and the probe is identified by the physical properties of the particle. . In a suitable embodiment, after removing the excess target, the particles are moved in a single transmission through a channel leading from the reaction chamber to the sensing device. When a single particle is used as a sensing device, they measure the physical properties of the target nucleic acid and the particle. In another suitable embodiment, before or after removing an excess of targets, the particles may have one of their physical properties, such as size (eg, extrusion chromatography), charge (eg, ion exchange chromatography), density-weight, or the like. Sort into sets based on complex properties. The particles thus separated are examined by a sensing device.
또 다른 구체예에서, 주요 반응 쳄버에는 완충액, 표적 핵산, 입자-프로브 복합체, 화학적 또는 효소적인 결찰 물질등이 공급된다. 이들 성분은 완전하게 혼합되어, 시약 쳄버에서 다수의 반응 쳄버로 나누어진다. 각 반응 쳄버에는 라벨된 자유 프로브를 가지고 있다. 또는 프로브-입자 복합체 풀은 이들을 시약 쳄버에 첨가하는 대신에 자유 프로브와 함체 반응 쳄버에 둔다. 추가로, 자유 프로브를 시약 쳄버에 첨가하고, 프로브 입자 출은 반응 쳄버에 첨가할 수 있다. 프로브-입자, 표적 핵산, 자유 프로브는 표적 핵산에 있는 인접 부위에 자유 프로브 및 입자-프로브가 결합할 수 있는 조건하에서 반응하여, 자유 프로브가 프로브 입자에 결찰된다. 과량의 자유 프로브(가령, 결찰안된) 및 표적 핵산은 반응 쳄버로부터 제거하고(세척을 이용), 결찰된 프로브는 자유 프로브 라벨 및 입자를 이용하여 확인하고, 입자에 복합된 프로브는 입자의 물리적인 성질을 이용하여 확인한다. 적절한 구체예에서, 과량의 프로브 및 표적을 제거한 후에, 입자는 반응 쳄버에서 감지 장치로 이어지는 체널을 통하여 1회 전송 이동된다. 단일 입자가 감지 장치로 이용될 때, 이들은 표적 핵산과 입자의 물리적인 성질을 측정한다. 또 다른 적절한 구체예에서, 과량의 표적을 제거하기 전 또는 후에, 입자는 크기(가령, 압출 크로마토그래피), 전하(가령, 이온 교환 크로마토그래피), 밀도-중량 등의 이들의 물리적인 성질 한가지 또는 복합 성질에 따라 세트로 분별한다. 이와 같이 분별된 입자는 감지 장치에 의해 검사한다.In another embodiment, the main reaction chamber is supplied with a buffer, target nucleic acid, particle-probe complex, chemical or enzymatic ligation material, and the like. These components are mixed thoroughly and divided into a plurality of reaction chambers in the reagent chamber. Each reaction chamber has a labeled free probe. Alternatively, the probe-particle complex pool is placed in the free reaction probe and containment reaction chamber instead of adding them to the reagent chamber. In addition, free probes can be added to the reagent chamber and probe particle exit can be added to the reaction chamber. The probe-particle, target nucleic acid, and free probe react under conditions such that the free probe and the particle-probe can bind to adjacent sites in the target nucleic acid so that the free probe is ligated to the probe particle. Excess free probes (e.g., ligated) and target nucleic acids are removed from the reaction chamber (using washing), the ligated probes are identified using free probe labels and particles, and probes conjugated to the particles are used to Check using properties. In suitable embodiments, after removal of excess probes and targets, particles are transferred once through the channel leading from the reaction chamber to the sensing device. When a single particle is used as a sensing device, they measure the physical properties of the target nucleic acid and the particle. In another suitable embodiment, before or after removing an excess of targets, the particles may have one of their physical properties, such as size (eg, extrusion chromatography), charge (eg, ion exchange chromatography), density-weight, or the like. Sort into sets based on complex properties. The particles thus separated are examined by a sensing device.
적절한 구체예에서, 장치에는 제 2 반응 쳄버가 있고, 프로브-입자 풀은 제 2 반응 쳄버에 위치한다. 완충액 및 표적이 시약 쳄버에서 혼합되고, 이들은 라벨된 자유 프로브를 포함하는 제 1 반응 쳄버로 공급된다. 프로브 및 표적이 혼합되고, 선택적으로 프로브는 표적에 하이브리드될 수 있다. 이와 같은 라벨된 프로브 및 표적은 프로브-입자 풀을 포함하는 제 2 반응 쳄버로 이동된다. 자유 프로브 및 프로브-입자는 표적에 하이브리드되고, 적절한 프로브는 제 2 반응 쳄버에 결찰된다. 결찰 물질을 시약 쳄버 또는 각 반응 쳄버에 첨가할 수 있는데, 적절하게는 결찰 시약은 제 2 반응 쳄버에 첨가한다. 제 2 반응 쳄버에 있는 프로브-입자 하이브리드반응 생성물은 상기와 같이 분석한다.In a suitable embodiment, the device has a second reaction chamber and the probe-particle pool is located in the second reaction chamber. The buffer and target are mixed in the reagent chamber and they are fed to a first reaction chamber containing a labeled free probe. The probe and the target are mixed and optionally the probe can be hybridized to the target. Such labeled probes and targets are transferred to a second reaction chamber containing a probe-particle pool. The free probe and probe-particle are hybridized to the target and the appropriate probe is ligated to the second reaction chamber. Ligation material may be added to the reagent chamber or to each reaction chamber, suitably adding the ligation reagent to the second reaction chamber. The probe-particle hybrid reaction product in the second reaction chamber is analyzed as above.
한 구체예에서, 표적 핵산은 분석전에(PCR 또는 람다 라이브러리등의 벡터에서) 증폭시키지 않는다. 적절하게는 더 긴 자유 프로브 및 입자 프로브를 이 구체예에서 이용하는데, 그 이유는 샘플의 서열 복합성이 증가되기 때문이다(배경 이상의 양성을 구별하기 위해).In one embodiment, the target nucleic acid is not amplified prior to analysis (in a vector such as a PCR or lambda library). Suitably longer free probes and particle probes are used in this embodiment because the sequence complexity of the sample is increased (to distinguish positives over background).
이 실시예에서 설명하는 프로브-입자 구체예는 설명한 여러 응용 분야에 이용할 수 있는데, 예를 들면, 설명한 진단 및 서열화 분야등에 이용할 수 있으나, 이에 국한되지는 않는다. 추가로, 이와 같은 프로브 입자 구체예를 기존에 설명한 변수 또는 변형을 이용하여 수정할 수도 있다.The probe-particle embodiments described in this example can be used in various described applications, for example, but not limited to the described diagnostic and sequencing fields. In addition, such probe particle embodiments may be modified using variables or modifications previously described.
실시예 37; 폴리뉴클레오티드간의 결합을 변형시키는 물질 존재하에 상보적인 폴리뉴클레오티드의 상호작용Example 37; Interaction of complementary polynucleotides in the presence of a substance that modifies the binding between polynucleotides
이 구체예에서, 물질을 첨가하여, 상보적인 폴리뉴클레오티드의 결합에서 미스메취로부터 완전하게 메취된 것을 구별하는 것을 조절할 수 있다. 적절한 구체예에서, 상보적인 폴리뉴클레오티드는 폴리뉴클레오티드 및 폴리뉴클레오티드 프로브이다. 물질을 첨가함으로써 미스메취된 것에서 완벽하게 메취된 것을 구별하는 것을 조절할 수 있는데, 이때 물질은 트리알킬 암모니움 염(e.g., TMAC, Ricelli et al., Nucl. Acids Res. 21:3785-3788(1993)), 염화 나트륨, 인산염, 붕소산염, 포름아미드, 글리콜, 디메틸설폭시드, 디메틸포름아미드, 요소, 구아니디움과 같은 유기 용매, 베타인과 같은 아미노산 유도체(Henke et al., Nucl. Acids Res. 19:3957-3958(1997); Rees et al., Biochemistry 32:137-144(1939)), 스페르미딘 및 스페르민과 같은 폴리아민(Thomas et al., Nucl. Acids Res. 25:2396-2402(1997)), 인산염 구조의 음전하를 중화시키는 다른 양전하를 띈 분자, 소듐 도데실 설페이트, 소듐 라우일 설페이트와 같은 계면활성제, 작은/큰 홈 결합제, 양전하를 띈 폴리펩티드, 아크리딘, 에티디움 브로마이드, 안트라신과 같은 삽입제등이 있다. 적절한 구체예에서, 물질 혼합물을 하이브리드 반응에 첨가하여, 미스메취된 것으로부터 완벽하게 메취된 것을 구별하는 것을 조절할 수 있다. 이와 같은 일부 물질은 두개 상보적인 가닥간의 용융 엔트로피를 감소시켜 구별에 영향을 준다.In this embodiment, the substance can be added to control the distinction of completely mesothelial from mismatches in the binding of complementary polynucleotides. In suitable embodiments, the complementary polynucleotides are polynucleotides and polynucleotide probes. The addition of a substance can control the differentiation of the mismatched one from the complete one, in which the substance is a trialkyl ammonium salt (eg, TMAC, Ricelli et al., Nucl. Acids Res. 21: 3785-3788 (1993). ), Sodium chloride, phosphate, boronate, formamide, glycol, dimethyl sulfoxide, dimethylformamide, urea, organic solvents such as guanidium, amino acid derivatives such as betaine (Henke et al., Nucl.Acids Res. 19: 3957-3958 (1997); Rees et al., Biochemistry 32: 137-144 (1939), polyamines such as spermidine and spermine (Thomas et al., Nucl.Acids Res. 25: 2396- 2402 (1997)), other positively charged molecules that neutralize the negative charges of the phosphate structure, surfactants such as sodium dodecyl sulfate, sodium lauyl sulfate, small / large groove binders, positively charged polypeptides, acridine, ethidium Inserts such as bromide and anthracyc. In a suitable embodiment, the substance mixture can be added to the hybrid reaction to control the distinction between perfectly mismatched and mismatched ones. Some such materials reduce the melting entropy between two complementary strands, thus affecting the distinction.
적절한 구체예에서, 이들 물질을 첨가하면, 미스메취된 것으로부터 메취된 것을 더 잘 구별할 수 있다. 예를 들면, 변성제로 흔히 이용되는 포름아미드는 format Ⅲ 반응에서 메스메취된 것과 완벽하게 메취된 것을 선호적으로 불안정화시키는 것으로 나타났다. 상기에서 설명한 것과 같이, format Ⅲ 반응을 셋업 시키고, 포름아미드의 양을 다양하게(0%, 10%, 20%, 30%, 40%, 50%)하여 첨가한다. 0%에서, 완전하게 메취된 시그날이 감지되고, 배경(미스메취)고 상당히 높다. 10% 포름아미드의 경우에, 우수한 메취 시그날이 있고, 배경/미스메취 시그날이 감소되었다. 20% 포름아미드에서, 완벽하게 메취된 시그날이 감소되었고(감지는 됨), 배경/미스메취 시그날은 없어졌다. 30%-50% 포름아미드에서는 완벽하게 메취된 시그날 및 배경/미스메취 시그날이 없었다.In suitable embodiments, the addition of these materials can better distinguish the mesmerized from the mismatched ones. For example, formamide, which is commonly used as a denaturant, has been shown to preferentially destabilize the mesmetheted and fully mesomethed in format III reactions. As described above, set up the format III reaction and add varying amounts of formamide (0%, 10%, 20%, 30%, 40%, 50%). At 0%, a fully embellished signal is detected and the background (mismatch) is quite high. In the case of 10% formamide, there is a good meth signal, and the background / mismethod signal is reduced. At 20% formamide, the perfectly mesmerized signal was reduced (detected) and the background / mismatched signal was lost. At 30% -50% formamide there was no perfectly medled signal and no background / mismatched signal.
또 다른 구체예에서, 물질을 첨가하여, 상보적인 올리고뉴클레오티드 쌍의 Tm을 감소 또는 증가시켰다. 좀더 적절한 구체예에서, 물질 혼합물을 이용하여 상보적인 올리고뉴클레오티드의 Tm을 증가 또는 감소시켰다. 물질은 여러가지 방법으로 Tm을 변경시키는데, 두 가지 예를 들면, (1) 두 개 상보적인 폴리뉴클레오티드 염기사이의 수소 결합을 파괴하는 물질(Goodman, Proc. Nat'l Acad. Sci. 94:10493-10495(1997); Moran et al., Proc. Nat'l Acad. Sci. 94:10506-10511(1997); Nguyen et al., Nucl. Acids Res. 25:3059-3065(1997)); (2) 폴리뉴클레오티드의 당-인산염 기본구조에서 인산염의 음전하를 중화시키거나 차단시키는 물질(Thomas et al., Nucl. Acids Res. 25:2396-2402(1997))등이 있으나 이에 국한되지는 않는다. (1) 또는 (2)를 강화 또는 약화시켜, 상보적인 폴리뉴클레오티드 쌍의 Tm을 조절할 수 있다.In another embodiment, material was added to reduce or increase the T m of complementary oligonucleotide pairs. In a more suitable embodiment, the material mixture was used to increase or decrease the T m of the complementary oligonucleotides. Substances modify T m in a number of ways, including two examples: (1) a substance that breaks the hydrogen bond between two complementary polynucleotide bases (Goodman, Proc. Nat'l Acad. Sci. 94: 10493 10495 (1997); Moran et al., Proc. Nat'l Acad. Sci. 94: 10506-10511 (1997); Nguyen et al., Nucl.Acids Res. 25: 3059-3065 (1997); (2) substances that neutralize or block the negative charge of phosphate in the sugar-phosphate framework of polynucleotides (Thomas et al., Nucl. Acids Res. 25: 2396-2402 (1997)), but are not limited thereto . Enhance or attenuate (1) or (2) to control the T m of the complementary polynucleotide pair.
가장 적절한 구체예에서, 물질을 첨가하여, GC 염기쌍의 결합 에너지를 감소시키거나 AT 염기쌍의 결합에너지를 증가시키거나 또는 둘다 할 수 있다. 적절한 구체예에서, 물질을 첨가하여, AT 염기쌍의 결합 에너지를 GC 염기쌍의 결합 에너지에 대략적으로 등가를 이루도록 한다. 따라서, 두 개 상보적인 폴리뉴클레오티드사이에 결합 에너지는 길이에 전적으로 의존한다. 이와 같은 상보적인 폴리뉴클레오티드의 결합 에너지는 폴리뉴클레오티드 기본구조에 있는 인산염 기의 음전하를 중화 또는 차단시킬 수 있는 물질을 첨가하여 증가시킬 수 있다.In the most suitable embodiment, the substance can be added to reduce the binding energy of the GC base pair, increase the binding energy of the AT base pair, or both. In suitable embodiments, a substance is added such that the binding energy of the AT base pair is approximately equivalent to the binding energy of the GC base pair. Thus, the binding energy between two complementary polynucleotides depends entirely on length. The binding energy of such complementary polynucleotides can be increased by the addition of a substance that can neutralize or block the negative charge of the phosphate groups in the polynucleotide framework.
본 발명은 본 발명의 단일 측면을 설명하기 위한 실시예에 국한되지 아니하고, 본 발명의 범위에는 이와 기능적으로 등가의 조성물 및 방법이 포함된다. 또한, 당분야에 적절한 실시예를 고려하여, 당업자는 본 발명의 실행에 있어서, 다양한 변형 및 변수를 예상할 수 있을 것이다. 결과적으로, 본 발명의 범위는 첨부된 청구범위로 한정한다.The invention is not limited to the examples for describing a single aspect of the invention, but the scope of the invention includes compositions and methods that are functionally equivalent thereto. In addition, those of ordinary skill in the art will envision various modifications and variables in the practice of the present invention in light of the examples that are appropriate to the art. As a result, the scope of the invention is defined by the appended claims.
본 명세어에 언급하는 모든 문헌은 전문을 참고문헌으로 첨부한다.All documents mentioned in this specification should be incorporated by reference in their entirety.
Claims (64)
Applications Claiming Priority (7)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| US08/912,885 US6383742B1 (en) | 1997-01-16 | 1997-08-15 | Three dimensional arrays for detection or quantification of nucleic acid species | 
| US08/912,885 | 1997-08-15 | ||
| US08/947,779 US20020034737A1 (en) | 1997-03-04 | 1997-10-09 | Methods and compositions for detection or quantification of nucleic acid species | 
| US08/947,779 | 1997-10-09 | ||
| US95936597A | 1997-10-28 | 1997-10-28 | |
| US08/959,365 | 1997-10-28 | ||
| PCT/US1998/016966 WO1999009217A1 (en) | 1997-08-15 | 1998-08-14 | Methods and compositions for detection or quantification of nucleic acid species | 
Publications (1)
| Publication Number | Publication Date | 
|---|---|
| KR20010022917A true KR20010022917A (en) | 2001-03-26 | 
Family
ID=60276276
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| KR1020007001522A Withdrawn KR20010022917A (en) | 1997-08-15 | 1998-08-14 | Methods and compositions for detection or quantification of nucleic acid species | 
Country Status (1)
| Country | Link | 
|---|---|
| KR (1) | KR20010022917A (en) | 
- 
        1998
        - 1998-08-14 KR KR1020007001522A patent/KR20010022917A/en not_active Withdrawn
 
Similar Documents
| Publication | Publication Date | Title | 
|---|---|---|
| AU745201B2 (en) | Methods and compositions for detection or quantification of nucleic acid species | |
| US6297006B1 (en) | Methods for sequencing repetitive sequences and for determining the order of sequence subfragments | |
| US6309824B1 (en) | Methods for analyzing a target nucleic acid using immobilized heterogeneous mixtures of oligonucleotide probes | |
| US20020034737A1 (en) | Methods and compositions for detection or quantification of nucleic acid species | |
| US6355419B1 (en) | Preparation of pools of nucleic acids based on representation in a sample | |
| AU8908198A (en) | Methods and compositions for detection or quantification of nucleic acid species | |
| EP0723598B1 (en) | Methods and compositions for efficient nucleic acid sequencing | |
| US7070927B2 (en) | Methods and compositions for efficient nucleic acid sequencing | |
| Chetverin et al. | Oligonucleotide arrays: New concepts and possibilities | |
| US20030036084A1 (en) | Nucleic acid detection method employing oligonucleotide probes affixed to particles and related compositions | |
| RU2143004C1 (en) | Method of determining nucleic acid sequence (versions) and kit for use in determination of nucleic acid sequence | |
| KR20010022917A (en) | Methods and compositions for detection or quantification of nucleic acid species | |
| EP1399588B1 (en) | Method and sequences for determinate nucleic acid hybridization | |
| CZ254699A3 (en) | Processes and compositions suitable for detection of quantification of types of nucleic acids | |
| WO1999036567A2 (en) | Enhanced discrimination of perfect matches from mismatches using a modified dna ligase | |
| HK1188607B (en) | Random array dna analysis by hybridization | |
| HK1188469A (en) | Random array dna analysis by hybridization | |
| HK1187949B (en) | Random array dna analysis by hybridization | |
| HK1187949A1 (en) | Random array dna analysis by hybridization | |
| HK1188469B (en) | Random array dna analysis by hybridization | 
Legal Events
| Date | Code | Title | Description | 
|---|---|---|---|
| PA0105 | International application | Patent event date: 20000215 Patent event code: PA01051R01D Comment text: International Patent Application | |
| PG1501 | Laying open of application | ||
| PC1203 | Withdrawal of no request for examination | ||
| WITN | Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid |