[go: up one dir, main page]

CN115867560B - 具有3’缩醛封端基团的核苷与核苷酸 - Google Patents

具有3’缩醛封端基团的核苷与核苷酸 Download PDF

Info

Publication number
CN115867560B
CN115867560B CN202180044416.1A CN202180044416A CN115867560B CN 115867560 B CN115867560 B CN 115867560B CN 202180044416 A CN202180044416 A CN 202180044416A CN 115867560 B CN115867560 B CN 115867560B
Authority
CN
China
Prior art keywords
nucleotide
polynucleotide
nucleotides
group
sequencing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202180044416.1A
Other languages
English (en)
Other versions
CN115867560A (zh
Inventor
A·弗朗卡斯
E·克雷西娜
A·马里亚尼
A·卡利
A·科特杰
刘小海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Cambridge Ltd
Original Assignee
Illumina Cambridge Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Cambridge Ltd filed Critical Illumina Cambridge Ltd
Priority to CN202510319781.9A priority Critical patent/CN120174072A/zh
Publication of CN115867560A publication Critical patent/CN115867560A/zh
Application granted granted Critical
Publication of CN115867560B publication Critical patent/CN115867560B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/173Purine radicals with 2-deoxyribosyl as the saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H1/00Processes for the preparation of sugar derivatives
    • C07H1/02Phosphorylation
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/073Pyrimidine radicals with 2-deoxyribosyl as the saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/06Pyrimidine radicals
    • C07H19/10Pyrimidine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H19/00Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof
    • C07H19/02Compounds containing a hetero ring sharing one ring hetero atom with a saccharide radical; Nucleosides; Mononucleotides; Anhydro-derivatives thereof sharing nitrogen
    • C07H19/04Heterocyclic radicals containing only nitrogen atoms as ring hetero atom
    • C07H19/16Purine radicals
    • C07H19/20Purine radicals with the saccharide radical esterified by phosphoric or polyphosphoric acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/02Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with ribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/117Modifications characterised by incorporating modified base
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2535/00Reactions characterised by the assay type for determining the identity of a nucleotide base or a sequence of oligonucleotides
    • C12Q2535/101Sanger sequencing method, i.e. oligonucleotide sequencing using primer elongation and dideoxynucleotides as chain terminators
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/55Design of synthesis routes, e.g. reducing the use of auxiliary or protecting groups

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Microbiology (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Medicinal Preparation (AREA)
  • Plural Heterocyclic Compounds (AREA)

Abstract

本发明涉及一种包含经由可裂解接头附接到可检测标记的核碱基的核苷或核苷酸,其中所述核苷或核苷酸包含核糖或2’脱氧核糖部分和3'‑OH封端基团,并且其中所述可裂解接头包含具有结构(I)的部分,其中X和Y各自独立地为O或S;并且Rla、R2b、R2、R3a和R3b各自独立地为H、卤素、未取代的或取代的C1‑C6烷基,或C1‑C6卤代烷基。本文还提供了制备此类核苷酸分子和核苷分子的方法,以及含有3’缩醛封端基团的完全官能化核苷酸用于测序应用的用途。

Description

具有3’缩醛封端基团的核苷与核苷酸
以引用方式并入的优先权申请
本申请要求2020年6月22日提交的美国临时申请号63/042,240的优先权权益,该临时申请全文以引用方式并入。
发明背景
技术领域
本公开整体上涉及包含3′缩醛封端基团的核苷酸、核苷或寡核苷酸,以及它们在多核苷酸测序方法中的用途。还公开了制备3′封端的核苷酸、核苷或寡核苷酸的方法。
背景技术
一直以来,分子研究的进展在某种程度上是由用于表征分子或其生物反应的技术的改进所引起的。特别地,核酸DNA和RNA研究得益于对用于序列分析的技术的开发以及对杂交事件的研究。
已改进核酸研究的技术的一个示例是开发固定化核酸的装配阵列。这些阵列通常由固定到固体载体材料上的多核苷酸的高密度矩阵组成。参见例如,Fodor等人,TrendsBiotech.12:19-26,1994,其描述了使用化学敏化玻璃表面组装核酸的方法,该化学敏化玻璃表面受掩模保护,但在限定的区域暴露以允许附接经适当修饰的核苷酸亚磷酰胺。装配阵列也可以通过将已知的多核苷酸“点样”到固体载体上的预定位置的技术来制造(例如,Stimpson等人,Proc.Natl.Acad.Sci.92:6379-6383,1995)。
确定与阵列结合的核酸的核苷酸序列的一种方法称为“边合成边测序”或“SBS”。在理想情况下,用于测定DNA的核苷酸序列的这种技术需要有控制地(即,每次一个)掺入与正在测序的核酸相反的正确互补核苷酸。这使得能够通过在多个循环中添加核苷酸来准确测序,由于每次只测序一个核苷酸残基,从而防止不受控制地掺入核苷酸序列。使用与掺入的核苷酸附接的适当标记来读取掺入的核苷酸,之后除去该标记部分,并进行随后的下一轮测序。
为了确保仅掺入单个核苷酸,在每个标记的核苷酸中包括结构修饰(“保护基团”或“封端基团”),该结构修饰被添加到生长链以确保仅掺入一个核苷酸。在添加具有保护基团的核苷酸后,在不干扰正在测序的DNA的完整性的反应条件下除去该保护基团。然后测序循环可以继续掺入下一个受保护的标记核苷酸。
为了用于DNA测序,核苷酸(通常是核苷酸三磷酸)一般需要3′-羟基保护基团,以便一旦在该核苷酸上添加碱基,就防止用于将其掺入多核苷酸链中的聚合酶继续复制。对于可以添加到核苷酸上并且仍然合适的基团的类型存在许多限制。保护基团应当防止额外的核苷酸分子被添加到多核苷酸链,同时又能够轻易地从糖部分除去,而不对多核苷酸链造成损伤。此外,经修饰的核苷酸需要与聚合酶或用于将其掺入多核苷酸链中的另一种适当的酶相容。因此,理想的保护基团必须表现出长期稳定性、能够被聚合酶有效地掺入、对核苷酸第二次或进一步掺入造成阻断,并且能够在不对多核苷酸结构造成损伤的温和条件下(优选地在含水条件下)除去。
之前已描述过可逆的保护基团。例如,Metzker等人(Nucleic Acids Research,22(20):4259-4267,1994)公开了八种3′-修饰的2-脱氧核糖核苷5’-三磷酸(3′-修饰的dNTP)的合成与用途,并在两种DNA模板测定中测试了它们的掺入活性。WO 2002/029003描述了一种测序方法,其可以包括在聚合酶反应中使用烯丙基保护基团来对DNA生长链上的3′-OH基团封端。
此外,之前在国际申请公开号WO 2004/018497和WO 2014/139596中报告了对许多可逆保护基团的开发以及在DNA相容条件下移除这些保护基团的方法,这两份国际申请公开中的每一者据此全文以引用方式并入。
发明内容
本公开的一些实施方案涉及包含经由可裂解接头附接到可检测标记的核碱基的核苷酸或核苷,其中该核苷或核苷酸包含核糖或2′脱氧核糖部分和3′-OH封端基团,并且其中该可裂解接头包含具有以下结构的部分:
其中X和Y各自独立地为O或S;并且R1a、R1b、R2、R3a和R3b各自独立地为H、卤素、未取代的或取代的C1-C6烷基,或C1-C6卤代烷基。
本公开的一些实施方案涉及包含本文所述的3′-OH封端的标记核苷酸的寡核苷酸或多核苷酸。
本公开的一些实施方案涉及一种在测序反应中制备与目标单链多核苷酸互补的生长中的多核苷酸的方法,该方法包括将本文所述的核苷酸分子掺入该生长中的互补多核苷酸中,其中掺入该核苷酸防止任何后续核苷酸引入该生长中的互补多核苷酸中。在一些实施方案中,掺入核苷酸是通过聚合酶、末端脱氧核苷酸转移酶(TdT)或逆转录酶完成的。在一个实施方案中,该掺入是通过聚合酶(例如,DNA聚合酶)完成的。
本公开的另外一些实施方案涉及一种用于确定目标单链多核苷酸的序列的方法,该方法包括:
(a)将本文所述的核苷酸掺入与目标多核苷酸链的至少一部分互补的拷贝多核苷酸链中;
(b)检测掺入该拷贝多核苷酸链中的核苷酸的身份;以及
(c)以化学方式从掺入该拷贝多核苷酸链中的核苷酸除去标记和3′-OH封端基团。
在一些实施方案中,检测步骤包括通过对来自可检测标记的荧光信号进行一次或多次测量来确定掺入该拷贝多核苷酸链中的核苷酸的身份。在一些实施方案中,该测序方法还包括(d)使用裂解后洗涤溶液将以化学方式除去的标记和3′-OH封端基团从拷贝多核苷酸链上洗掉。在一些实施方案中,这种洗涤步骤还除去了未掺入的核苷酸。在其他实施方案中,该方法可以包括单独的洗涤步骤,用于在步骤(b)之前将未掺入的核苷酸从拷贝多核苷酸链上洗掉。在一些此类实施方案中,在引入下一个互补核苷酸之前,将掺入的核苷酸的3′-OH封端基团和可检测标记除去。在另外一些实施方案中,在化学反应的单个步骤中除去3′-OH封端基团和可检测标记。在一些实施方案中,本文所述的按顺序掺入进行至少50次、至少100次、至少150次、至少200次或至少250次。
本公开的另外一些实施方案涉及包含本文所述的多个核苷酸或核苷分子及其包装材料的试剂盒。本文阐述的核苷酸、核苷、寡核苷酸或试剂盒可以用于检测、测量或识别生物系统(包括例如其过程或组分)。可以采用这些核苷酸、寡核苷酸或试剂盒的示例性技术包括测序、表达分析、杂交分析、遗传分析、RNA分析、细胞测定(例如,细胞结合或细胞功能分析),或者蛋白质测定(例如,蛋白质结合测定或蛋白质活性测定)。该用途可以是在用于执行特定技术的自动化仪器(诸如自动化测序仪器)上。该测序仪器可以包含以不同波长工作的两个或更多个激光器,以区分不同的可检测标记。
附图说明
图1是比较[(烯丙基)PdCl]2与Na2PdCl4在使用各种比例的三(羟丙基)膦(THP)时的3′-OH解封效率的折线图。
图2是折线图,示出了具有LN3接头部分和3′-O-叠氮甲基封端基团的标准完全官能化核苷酸(ffN)与具有AOL接头部分和3'-AOM封端基团的ffN相比,预定相百分比值随时间的变化。
图3展示了在使用具有3'-AOM封端基团的完全官能化核苷酸(ffN)时,在裂解后的洗涤步骤中使用钯清除剂和不使用钯清除剂的情况下,Illumina的仪器上的定相值的比较。
图4展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在使用了钯清除剂的情况下,Illumina的仪器上的主要测序指标(包括定相、预定相和错误率),以及与之比较的在使用具有3'-O-叠氮甲基封端基团的标准ffN时的相同测序指标。
图5展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在掺入混合物中分别使用甘氨酸或乙醇胺的情况下,Illumina的仪器上的主要测序指标(包括定相和预定相)的比较。
图6展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在掺入混合物中使用甘氨酸的情况下,Illumina的仪器上的主要测序指标(包括定相、预定相和错误率),以及与之比较的在使用具有3'-O-叠氮甲基封端基团的标准ffN时的相同测序指标。
图7A和图7B分别展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,Illumina的iSeqTM仪器上的2×300次测序运行的错误率和Q30测序指标,以及与之比较的在使用具有3'-O-叠氮甲基封端基团的标准ffN时的相同测序指标。
图8A和图8B分别展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,Illumina的iSeqTM仪器上的2×150次测序运行的错误率和Q30测序指标,以及与之比较的在使用具有3'-O-叠氮甲基封端基团的标准ffN时的相同测序指标。
图9A至图9E展示了当绿色激光功率恒定时主要测序指标(定相、信号衰减百分比、错误率)随蓝色激光功率的变化。这些测序实验是使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN),在使用了钯清除剂L-半胱氨酸的情况下在Illumina的NovaSeqTM仪器上进行的,与之比较的是在使用标准方案和具有3'-O-叠氮甲基封端基团的ffN时的相同测序指标。
图10展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在SBS的化学线性化的第一步中也使用了相同的钯裂解混合物的情况下,Illumina的iSeqTM仪器(1×150个循环)上的主要测序指标(%PF、错误率、Q30和信号衰减),以及与之比较的相同ffN在使用标准酶促线性化的情况下的SBS。
具体实施方式
本公开的实施方案涉及用于测序应用(例如,边合成边测序(SBS))的具有3′缩醛封端基团的核苷和核苷酸。在一些实施方案中,该核苷或核苷酸包含通过可裂解接头共价附接到其上的标记,其中该可裂解接头包含允许在单个反应步骤中将3’缩醛封端基团和标记裂解的缩醛部分。3′缩醛封端基团在完全官能化核苷酸(ffN)的合成期间提供了改善的稳定性,而且在溶液中配制、储存期间以及在测序仪器上操作期间提供了极大的稳定性。此外,本文所述的3′缩醛封端基团还可以实现低预定相、较低的信号衰减,从而改善数据质量,这使得能够从测序应用中进行较长的读取。
定义
除非另有定义,否则本文所用的所有技术和科学术语的含义与本领域的普通技术人员通常理解的含义相同。术语“包括”以及其他形式(诸如“包括(include/includes/included)”)的使用不是限制性的。术语“具有”以及其他形式(诸如“具有(have/has/had)”)的使用不是限制性的。如本说明书中所用,无论是在过渡短语中还是在权利要求的正文中,术语“包含(comprise(s))”和“包含(comprising)”都将被解释为具有开放式含义。即,上述术语应与短语“至少具有”或“至少包括”同义地解释。例如,当在过程的上下文中使用时,术语“包含”表示该过程至少包括所列举的步骤,但是也可包括额外步骤。当在化合物、组合物或设备的上下文中使用时,术语“包含”是指该化合物、组合物或设备至少包含所列举的特征或组分,但是也可包含额外特征或组分。
在提供值的范围的情况下,应当理解,该范围的上限和下限以及上限与下限之间的每个中间值均涵盖在这些实施方案内。
如本文所用,常见的有机缩写定义如下:
℃ 以摄氏度为单位的温度值
dATP 脱氧腺苷三磷酸
dCTP 脱氧胞苷三磷酸
dGTP 脱氧鸟苷三磷酸
dTTP 脱氧胸苷三磷酸
ddNTP 双脱氧核苷酸三磷酸
ffN 完全官能化核苷酸
RT 室温
SBS 边合成边测序
SM 起始材料
如本文所用,术语“阵列”是指以下不同探针分子的群体:这些探针分子附接到一种或多种基底,使得不同探针分子可以根据相对位置彼此区分。阵列可以包括各自位于一个基底上的不同可寻址位置的不同探针分子。替代性地,或除此之外,阵列可以包括各自承载不同探针分子的分开的基底,其中可以根据基底在基底所附接到的表面上的位置或根据基底在液体中的位置来识别不同的探针分子。其中分开的基底位于表面上的示例性阵列包括但不限于在孔中包括珠粒的那些阵列,如例如美国专利号6,355,431B1、US 2002/0102578和PCT公开号WO 00/63437中所述。例如,在美国专利号6,524,793中描述了可以用于本发明中以例如使用诸如荧光激活细胞分选器(FACS)的微流体装置来区分液体阵列中的珠粒的示例性格式。可以用于本发明中的阵列的另外的示例包括但不限于以下专利中所述的那些:美国专利号5,429,807、5,436,327、5,561,071、5,583,211、5,658,734、5,837,858、5,874,219、5,919,523、6,136,269、6,287,768、6,287,776、6,288,220、6,297,006、6,291,193、6,346,413、6,416,949、6,482,591、6,514,751和6,610,482,WO 93/17126、WO 95/11995、WO 95/35505、EP 742 287和EP 799 897。
如本文所用,术语“共价连接的”或“共价键合的”是指形成特征在于原子之间共用电子对的化学键合。例如,共价连接的聚合物涂层是指与底物的官能化表面形成化学键的聚合物涂层,这与经由其他方式(例如,粘附或静电相互作用)粘附到该表面形成比较。应当理解,共价连接到表面的聚合物也可以经由除共价连接之外的方式键合。
如本文所用,任何“R”基团均表示可以附接到指定原子的取代基。R基团可以是取代的或未取代的。如果两个“R”基团被描述为“与它们所附接的原子一起”形成环或环系,则意味着这些原子、居间的键和这两个R基团的集合单元是所提到的环。例如,当存在以下子结构时:
并且R1和R2被限定为选自由氢和烷基组成的组,或者R1和R2连同它们所附接的原子一起形成芳基或碳环基,这意味着R1和R2可以选自氢或烷基,或者替代性地,该子结构具有结构:
其中A为含有所描绘的双键的芳环或碳环基。
应当理解,根据上下文,某些基团命名惯例可以包括单基或二基。例如,当取代基需要两个与分子其余部分的连接点时,应当理解,该取代基为二基。例如,被识别为需要两个连接点的烷基的取代基包括二基,诸如–CH2–、–CH2CH2–、–CH2CH(CH3)CH2–等。其他基团命名惯例清楚地指示该基团为二基,诸如“亚烷基”或“亚烯基”。
如本文所用,术语“卤素”或“卤基”意味着元素周期表第7列的放射性稳定原子中的任一种,例如,氟、氯、溴或碘,其中氟和氯是优选的。
如本文所用,其中“a”和“b”是整数的“Ca至Cb”是指烷基、烯基或炔基基团中的碳原子数,或者环烷基或芳基基团的环原子数。即,烷基、烯基、炔基、环烷基的环和芳基的环可以含有“a”至“b”个(包括端值在内)的碳原子。例如,“C1至C4烷基”基团是指具有1至4个碳的所有烷基基团,也就是CH3-、CH3CH2-、CH3CH2CH2-、(CH3)2CH-、CH3CH2CH2CH2-、CH3CH2CH(CH3)-和(CH3)3C-;C3至C4环烷基基团是指具有3至4个碳原子的所有环烷基基团,即环丙基和环丁基。类似地,“4至6元杂环基”基团是指具有4至6个总环原子的所有杂环基基团,例如氮杂环丁烷、氧杂环丁烷、噁唑啉、吡咯烷、哌啶、哌嗪、吗啉等。如果对于烷基、烯基、炔基、环烷基或芳基基团没有指定“a”和“b”,则将假设这些定义中描述的最广泛范围。如本文所用,术语“C1-C6”包括C1、C2、C3、C4、C5和C6,以及由这些数中的任何两个数定义的范围。例如,C1-C6烷基包括C1烷基、C2烷基、C3烷基、C4烷基、C5烷基和C6烷基、C2-C6烷基、C1-C3烷基等。类似地,C2-C6烯基包括C2烯基、C3烯基、C4烯基、C5烯基和C6烯基、C2-C5烯基、C3-C4烯基等;并且C2-C6炔基包括C2炔基、C3炔基、C4炔基、C5炔基和C6炔基、C2-C5炔基、C3-C4炔基等。C3-C8环烷基各自包括含有3、4、5、6、7和8个碳原子或由任何两个数字限定的范围的烃环,诸如C3-C7环烷基或C5-C6环烷基。
如本文所用,“烷基”是指完全饱和(即,不包含双键和三键)的直链或支链烃链。烷基基团可以具有1至20个碳原子(每当在本文中出现时,诸如“1至20”的数值范围是指给定范围内的每个整数;例如,“1至20个碳原子”意味着烷基基团可以由1个碳原子、2个碳原子、3个碳原子等,最多至并包括20个碳原子组成,但本定义还涵盖出现其中没有指定数值范围的术语“烷基”)。烷基基团还可以是具有1至9个碳原子的中等大小烷基。烷基基团还可以是具有1至6个碳原子的低级烷基。烷基基团可以被命名为“C1-C4烷基”或类似的名称。仅以举例的方式,“C1-C6烷基”表示烷基链中存在一个至六个碳原子,即,烷基链选自由甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基组成的组。典型的烷基基团包括但绝不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基、己基等。
如本文所用,“烷氧基”是指式–OR(其中R为如上文所定义的烷基),诸如“C1-C9烷氧基”,包括但不限于甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基等。
如本文所用,“烯基”是指包含一个或多个双键的直链或支链烃链。烯基基团可以具有2至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“烯基”。烯基基团还可以是具有2至9个碳原子的中等大小烯基。烯基基团还可以是具有2至6个碳原子的低级烯基。烯基基团可以被命名为“C2-C6烯基”或类似的名称。仅以举例的方式,“C2-C6烯基”表示烯基链中存在两个至六个碳原子,即,烯基链选自由乙烯基、丙烯-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基-丙烯-1-基、2-甲基-丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基和丁-1,2-二烯-4-基组成的组。典型的烯基基团包括但绝不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基等。
如本文所用,“炔基”是指包含一个或多个三键的直链或支链烃链。炔基基团可以具有2至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“炔基”。炔基基团还可以是具有2至9个碳原子的中等大小炔基。炔基基团还可以是具有2至6个碳原子的低级炔基。炔基基团可以被命名为“C2-C6炔基”或类似的名称。仅以举例的方式,“C2-C6炔基”表示炔基链中存在两个至六个碳原子,即,炔基链选自由乙炔基、丙炔-1-基、丙炔-2-基、丁炔-1-基、丁炔-3-基、丁炔-4-基和2-丁炔基组成的组。典型的炔基基团包括但绝不限于乙炔基、丙炔基、丁炔基、戊炔基和己炔基等。
如本文所用,“杂烷基”是指在链骨架中含有一个或多个杂原子(即,除碳之外的元素,包括但不限于氮、氧和硫)的直链或支链烃链。杂烷基基团可以具有1至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“杂烷基”。杂烷基基团还可以是具有1至9个碳原子的中等大小杂烷基。杂烷基基团还可以是具有1至6个碳原子的低级杂烷基。杂烷基基团可以被命名为“C1-C6杂烷基”或类似的名称。杂烷基基团可以含有一个或多个杂原子。仅以举例的方式,“C4-C6杂烷基”表示杂烷基链中存在四个至六个碳原子,此外在链的骨架中还存在一个或多个杂原子。
术语“芳族”是指具有共轭π电子体系的环或环系,并且包括碳环芳族基团(例如,苯基)和杂环芳族基团(例如,吡啶)这两者。该术语包括单环基团或稠环多环(即,共用相邻原子对的环)基团,前提条件是整个环系是芳族的。
如本文所用,“芳基”是指在环骨架中仅包含碳的芳族环或环系(即,共用两个相邻碳原子的两个或更多个稠环)。当芳基为环系时,该环系中的每个环均为芳族的。芳基基团可以具有6至18个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“芳基”。在一些实施方案中,芳基基团具有6至10个碳原子。芳基基团可以被命名为“C6-C10芳基”、“C6或C10芳基”或类似的名称。芳基基团的示例包括但不限于苯基、萘基、薁基和蒽基。
“芳烷基”或“芳基烷基”为作为取代基经由亚烷基基团连接的芳基基团,诸如“C7-14芳烷基”等,包括但不限于苄基、2-苯基乙基、3-苯基丙基和萘基烷基。在一些情况下,亚烷基基团为低级亚烷基基团(即,C1-C6亚烷基基团)。
如本文所用,“杂芳基”是指在环骨架中含有一个或多个杂原子(即,除碳之外的元素,包括但不限于氮、氧和硫)的芳族环或环系(即,共用两个相邻原子的两个或更多个稠环)。当杂芳基是环系时,该环系中的每个环均是芳族的。杂芳基基团可以具有5至18个环成员(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂芳基”。在一些实施方案中,杂芳基基团具有5至10个环成员或者5至7个环成员。杂芳基基团可以被命名为“5至7元杂芳基”、“5至10元杂芳基”或类似的名称。杂芳基环的示例包括但不限于呋喃基、噻吩基、酞嗪基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、异噁唑基、异噻唑基、三唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、三嗪基、喹啉基、异喹啉基、苯并咪唑基、苯并噁唑基、苯并噻唑基、吲哚基、异吲哚基和苯并噻吩基。
“杂芳烷基”或“杂芳基烷基”为作为取代基经由亚烷基基团连接的杂芳基基团。示例包括但不限于2-噻吩基甲基、3-噻吩基甲基、呋喃基甲基、噻吩基乙基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基。在一些情况下,亚烷基基团为低级亚烷基基团(即,C1-C6亚烷基基团)。
如本文所用,“碳环基”意味着在环系骨架中仅含有碳原子的非芳族环状环或环系。当碳环基为环系时,两个或更多个环可以以稠合、桥接或螺接的方式接合在一起。碳环基可以具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。因此,碳环基包括环烷基、环烯基和环炔基。碳环基基团可以具有3至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“碳环基”。碳环基基团也可以是具有3至10个碳原子的中等大小碳环基。碳环基基团也可以是具有3至6个碳原子的碳环基。碳环基基团可以被命名为“C3-C6碳环基”或类似的名称。碳环基环的示例包括但不限于环丙基、环丁基、环戊基、环己基、环己烯基、2,3-二氢-茚、双环[2.2.2]辛烷基、金刚烷基和螺[4.4]壬烷基。
如本文所用,“环烷基”意味着完全饱和的碳环基环或环系。示例包括环丙基、环丁基、环戊基和环己基。
如本文所用,“杂环基”是指在环骨架中含有至少一个杂原子的非芳族环状环或环系。杂环基可以稠合、桥接或螺接的方式接合在一起。杂环基可具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。杂原子可以存在于环系中的非芳族环或芳族环中。杂环基基团可以具有3至20个环元(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂环基”。杂环基基团也可以是具有3至10个环元的中等大小杂环基。杂环基基团也可以是具有3至6个环元的杂环基。杂环基基团可以被命名为“3至6元杂环基”或类似的名称。在优选的六元单环杂环基中,杂原子选自O、N或S中的一个至最多三个,并且在优选的五元单环杂环基中,杂原子选自一个或两个选自O、N或S的杂原子。杂环基环的示例包括但不限于吖庚因基、吖啶基、咔唑基、噌啉基、二氧戊环基、咪唑啉基、咪唑烷基、吗啉基、环氧乙烷基、氧杂环庚烷基、硫杂环庚烷基、哌啶基、哌嗪基、二氧代哌嗪基、吡咯烷基、吡咯烷基、吡咯烷二酮基、4-哌啶酮基、吡唑啉基、吡唑烷基、1,3-二噁英基、1,3-二噁烷基、1,4-二噁英基、1,4-二噁烷基、1,3-氧硫杂环己烷基、1,4-氧硫杂环己烯基、1,4-氧硫杂环己烷基、2H-1,2-噁嗪基、三噁烷基、六氢-1,3,5-三嗪基、1,3-间二氧杂环戊烯基、1,3-二氧戊环基、1,3-二噻吩基、1,3-二噻烷基、异噁唑啉基、异噁唑烷基、噁唑啉基、噁唑烷基、噁唑烷酮基、噻唑啉基、噻唑烷基、1,3-氧硫杂环戊烷基、二氢吲哚基、异二氢吲哚基、四氢呋喃基、四氢吡喃基、四氢噻吩基、四氢噻喃基、四氢-1,4-噻嗪基、硫代吗啉基、二氢苯并呋喃基、苯并咪唑烷基和四氢喹啉。
如本文所用,“烷氧基烷基”或“(烷氧基)烷基”是指经由亚烷基基团连接的烷氧基基团,诸如C2-C8烷氧基烷基,或(C1-C6烷氧基)C1-C6烷基,例如–(CH2)1-3-OCH3
如本文所用,“-O-烷氧基烷基”或“-O-(烷氧基)烷基”是指经由–O-(亚烷基)基团连接的烷氧基基团,诸如–O-(C1-C6烷氧基)C1-C6烷基,例如–O-(CH2)1-3-OCH3
如本文所用,“(杂环基)烷基”是指作为取代基经由如上文所定义的亚烷基基团连接的如上文所定义的杂环或杂环基基团。(杂环基)烷基的亚烷基基团和杂环基基团可以是取代的或未取代的。示例包括但不限于(四氢-2H-吡喃-4-基)甲基、(哌啶-4-基)乙基、(哌啶-4-基)丙基、(四氢-2H-噻喃-4-基)甲基和(1,3-噻嗪烷-4-基)甲基。
如本文所用,“(环烷基)烷基”或“(碳环基)烷基”是指作为取代基经由亚烷基基团连接的环烷基或碳环基基团(如本文所定义的)。示例包括但不限于环丙基甲基、环丁基甲基、环戊基乙基和环己基丙基。
“O-羧基”基团是指其中R选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-OC(=O)R”基团,如本文所定义的。
“C-羧基”基团是指其中R选自由氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基组成的组的“-C(=O)OR”基团,如本文所定义的。非限制性示例包括羧基(即,-C(=O)OH)。
“磺酰基”基团是指其中R选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-SO2R”基团,如本文所定义的。
“亚磺酸基”基团是指“-S(=O)OH”基团。
“S-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-SO2NRARB”基团,如本文所定义的。
“N-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-N(RA)SO2RB”基团,如本文所定义的。
“C-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-C(=O)NRARB”基团,如本文所定义的。
“N-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-N(RA)C(=O)RB”基团,如本文所定义的。
“氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-NRARB”基团,如本文所定义的。非限制性示例包括游离氨基(即,-NH2)。
“氨基烷基”基团是指经由亚烷基基团连接的氨基基团。
“(烷氧基)烷基”基团是指经由亚烷基基团连接的烷氧基基团,诸如“(C1-C6烷氧基)C1-C6烷基”等。
如本文所用的术语“羟基”是指–OH基团。
如本文所用的术语“氰基”是指“-CN”基团。
如本文所用的术语“叠氮基”是指-N3基团。
如本文所用的术语“炔丙胺”是指被炔丙基基团取代的氨基基团(HC≡C-CH2-)。当炔丙胺在上下文中用作二价部分时,其包括-C≡C-CH2-NRA-,其中RA是氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基,如本文所定义的。
如本文所用的术语“炔丙酰胺”是指被炔丙基基团取代的C-酰氨基或N-酰氨基基团(HC≡C-CH2-)。当炔丙酰胺在上下文中用作二价部分时,其包括-C≡C-CH2-NRA-C(=O)-或-C≡C-CH2-C(=O)-NRA-,其中RA是氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基,如本文所定义的。
如本文所用的术语“烯丙胺”是指被烯丙基基团取代的氨基基团(CH2=CH-CH2-)。当烯丙胺在上下文中用作二价部分时,其包括-CH=CH-CH2-NRA-,其中RA是氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基,如本文所定义的。
如本文所用的术语“烯丙酰胺”是指被烯丙基基团取代的C-酰氨基或N-酰氨基基团(CH2=CH-CH2-)。当烯丙酰胺在上下文中用作二价部分时,其包括-CH=CH-CH2-NRA-C(=O)-或-CH=CH-CH2-C(=O)-NRA-,其中RA是氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基,如本文所定义的。
当基团被描述为“任选地取代的”时,它可以是未取代的或取代的。同样,当基团被描述为“取代的”时,取代基可以选自所指出的取代基中的一者或多者。如本文所用,取代的基团衍生自未取代的母体基团,其中已存在一个或多个氢原子与另一个原子或基团的交换。除非另外指明,否则当基团被认为是“取代的”时,这意味着该基团被一个或多个取代基取代,所述取代基独立地选自:C1-C6烷基、C1-C6烯基、C1-C6炔基、C1-C6杂烷基、C3-C7碳环基(任选被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、C3-C7碳环基-C1-C6-烷基(任选被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3至10元杂环基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3至10元杂环基-C1-C6-烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、(芳基)C1-C6烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、(5至10元杂芳基)C1-C6烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5至10元杂芳基(C1-C6)烷基(任选地被卤基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、卤基、-CN、羟基、C1-C6烷氧基、(C1-C6烷氧基)C1-C6烷基、-O(C1-C6烷氧基)C1-C6烷基;(C1-C6卤代烷氧基)C1-C6烷基;-O(C1-C6卤代烷氧基)C1-C6烷基;芳氧基、巯基(氢硫基)、卤代(C1-C6)烷基(例如,
–CF3)、卤代(C1-C6)烷氧基(例如,–OCF3)、C1-C6烷硫基、芳硫基、氨基、氨基(C1-C6)烷基、硝基、O-氨甲酰基、N-氨甲酰基、O-硫代氨甲酰基、N-硫代氨甲酰基、C-酰氨基、N-酰氨基、S-亚磺酰氨基、N-亚磺酰氨基、C-羧基、O-羧基、酰基、氰酸根、异氰酸根、硫氰酸根、异硫氰酸根、亚磺酰基、磺酰基、-SO3H、亚磺基、-OSO2C1-4烷基、单磷酸根、二磷酸根、三磷酸根和氧代基(=O)。在基团被描述为“任选地取代的”的任何地方,该基团可以被上述取代基取代。
当取代基被描述为二基(即,具有与分子的其余部分的两个连接点)时,应理解,除非另外指明,否则取代基可以任何定向构型连接。因此,例如,描绘为-AE-或的取代基包括被定向成使得A连接在分子的最左侧连接点的取代基,以及其中A连接在所述分子的最右侧连接点处的取代基。此外,如果基团或取代基被描绘为并且L被定义为任选地存在的接头部分;则当L不存在(或没有)时,这种基团或取代基等于
如本文所用,“核苷酸”包括含氮杂环碱基、糖以及一个或多个磷酸基团。它们是核酸序列的单体单元。在RNA中,糖为核糖,并且在DNA中为脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮杂环碱基可为嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G)以及它们的修饰衍生物或类似物。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及它们的修饰衍生物或类似物。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。
如本文所用,“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团连接到糖分子的核苷类似物。术语“核苷”在本文中以本领域技术人员所理解的常规含义使用。示例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。经修饰的戊糖部分是其中氧原子已被碳取代和/或碳已被硫或氧原子取代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。另外,核苷可以掺入较大的DNA和/或RNA聚合物和低聚物中。
术语“嘌呤碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。类似地,术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。任选地取代的嘌呤碱基的非限制性列表包括嘌呤、脱氮嘌呤、腺嘌呤、7-脱氮腺嘌呤、鸟嘌呤、7-脱氮鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的示例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如5-甲基胞嘧啶)。
如本文所用,当寡核苷酸或多核苷酸被描述为“包含”本文所述的核苷或核苷酸或者用本文所述的核苷或核苷酸标记时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。类似地,当核苷或核苷酸被描述为寡核苷酸或多核苷酸的一部分,诸如“掺入到”寡核苷酸或多核苷酸中时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。在一些此类实施方案中,共价键在寡核苷酸或多核苷酸的3'羟基与在本文中描述为寡核苷酸或多核苷酸的3'碳原子与核苷酸的5'碳原子之间的磷酸二酯键的核苷酸的5'磷酸基团之间形成。
如本文所用,术语“可裂解接头”并不意在暗示需要除去整个接头。裂解位点可以位于该接头上确保该接头的一部分在裂解后保持附接到可检测标记和/或核苷或核苷酸部分的某个位置处。
如本文所用,“衍生物”或“类似物”意指具有经修饰的碱基部分和/或经修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,NucleotideAnalogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键和氨基磷酸酯键。如本文所用,“衍生物”、“类似物”和“修饰的”可以互换使用,并且由本文定义的术语“核苷酸”和“核苷”涵盖。
如本文所用,术语“磷酸酯”以本领域技术人员所理解的普通含义使用,并且包括其质子化形式(例如,)。如本文所用,术语“单磷酸”、“二磷酸”和“三磷酸”以本领域技术人员所理解的其普通含义使用,并且包括质子化形式。
如本文所用,术语“保护基团(protecting group/protecting groups)”是指添加到分子中以便防止分子中的现有基团经历不希望的化学反应的任何原子或原子团。有时,“保护基团”和“封端基团”可以互换使用。
如本文所用,术语“定相”是指SBS中的一种现象,该现象是由3′终止子和荧光团的不完全去除以及未能在给定的测序循环中由聚合酶完成对簇内DNA链的一部分的掺入所引起的。预定相是由掺入不具有有效的3′终止子的核苷酸所引起的,其中该掺入事件由于终止失败而提前1个循环出现。定相和预定相导致特定循环的测量信号强度由来自当前循环的信号以及来自前一个和后一个循环的噪声组成。随着循环的数量增加,受到定相和预定相影响的每个簇的序列分数增加,妨碍对正确碱基的识别。预定相可以由在边合成边测序(SBS)期间存在痕量的未受保护或未封端的3′-OH核苷酸引起。未受保护的3′-OH核苷酸可能在制造过程期间产生,也可能在储存过程和试剂处理过程期间产生。因此,存在使预定相发生率降低的核苷酸类似物,这一发现令人惊讶,并且在SBS应用中提供了优于现有核苷酸类似物的巨大优势。例如,所提供的核苷酸类似物可以使SBS循环时间缩短、定相值和预定相值降低,以及测序读段长度变长。
具有3′缩醛封端基团的核苷或核苷酸
本公开的一些实施方案涉及一种核苷酸或核苷分子,其包含经由可裂解接头附接到可检测标记的核碱基,以及核糖或脱氧核糖部分,其中该可裂解接头包含具有以下结构的部分:
其中X和Y各自独立地为O或S;并且R1a、R1b、R2、R3a和R3b各自独立地为H、卤素、未取代的或取代的C1-C6烷基,或C1-C6卤代烷基。在一些实施方案中,核糖或脱氧核糖部分包含本文所述的3′-OH保护基团。在一些实施方案中,可裂解接头还可以包括L1或L2,或这两者,其中L1和L2在下文详细描述。
在一些实施方案中,本文所述的核苷或核苷酸包含或具有式(I)的结构:
其中B为核碱基;
R4为H或OH;
R5为H、3′-OH封端基团或亚磷酰胺;
R6为H、单磷酸根、二磷酸根、三磷酸根、硫代磷酸根、磷酸酯类似物、反应性含磷基团,或羟基保护基团;
L为并且
L1和L2各自独立地为任选地存在的接头部分。
在本文所述可裂解接头部分的一些实施方案中,X和Y各自为O。在一些其他实施方案中,X为S并且Y为O,或者X为O并且Y为S。在一些实施方案中,R1a、R1b、R2、R3a和R3b各自为H。在其他实施方案中,R1a、R1b、R2、R3a和R3b中的至少一者为卤素(例如,氟、氯)或未取代的C1-C6烷基(例如,甲基、乙基、异丙基、异丁基或叔丁基)。在一些此类情况下,R1a和R1b各自为H,并且R2、R3a和R3b中的至少一者为未取代的C1-C6烷基或卤素(例如,R2为未取代的C1-C6烷基,并且R3a和R3b各自为H;或者R2为H,并且R3a和R3b中的一者或两者为卤素或未取代的C1-C6烷基)。在一个实施方案中,可裂解接头或L包含(“AOL”接头部分)。
在本文所述核苷或核苷酸的一些实施方案中,核碱基(式(I)中的“B”)为嘌呤(腺嘌呤或鸟嘌呤)、脱氮嘌呤或嘧啶(例如,胞嘧啶、胸腺嘧啶或尿嘧啶)。在另外一些实施方案中,脱氮嘌呤为7-脱氮嘌呤(例如,7-脱氮腺嘌呤或7-脱氮鸟嘌呤)。B的非限制性示例包括 或者它们的任选地取代的衍生物和类似物。在一些另外的实施方案中,标记的核碱基包括结构
在本文所述核苷或核苷酸的一些实施方案中,核糖或脱氧核糖部分包含3′-OH封端基团(即,式(I)中的R5为3′-OH封端基团)。在一些实施方案中,3′-OH封端基团或R5并且其中Ra、Rb、Rc、Rd和Re各自独立地为H、卤素、未取代的或取代的C1-C6烷基,或C1-C6卤代烷基。在另外一些实施方案中,Ra和Rb各自为H,并且Rc、Rd和Re中的至少一者独立地为卤素(例如,氟、氯)或未取代的C1-C6烷基(例如,甲基、乙基、异丙基、异丁基或叔丁基)。例如,Rc为未取代的C1-C6烷基,并且Rd和Re各自为H。在另一个示例中,Rc为H,并且Rd和Re中的一者或两者为卤素或未取代的C1-C6烷基。R5的其他非限制性实施方案包括 在一个实施方案中,R5其与3′氧基一起形成(“AOM”)基团,该AOM基团附接到核糖或脱氧核糖部分的3′碳原子上。在其他实施方案中,3′-OH封端基团或R5可以包含叠氮基部分(例如,-CH2N3或叠氮甲基)。3′-OH封端基团的附加实施方案描述于美国专利公布号2020/0216891A1中,该美国专利公布全文以引用方式并入,其包括3′缩醛封端基团的附加示例,诸如这些封端基团附接到核糖或脱氧核糖部分的3′碳原子。
在本文所述核苷或核苷酸的一些其他实施方案中,式(I)中的R5为亚磷酰胺。在此类实施方案中,R6为可酸裂解的羟基保护基团,其允许随后在自动化合成条件下进行单体偶联。
在本文所述核苷或核苷酸的一些实施方案中,L1存在,并且L1包括选自由以下项组成的组的部分:炔丙胺、炔丙酰胺、烯丙胺、烯丙酰胺,以及这些物质的任选地取代的变体。在另外一些实施方案中,L1包括或为 在另外一些实施方案中,星号*指示L1与核碱基(例如,嘧啶碱基的C5位,或者7-脱氮嘌呤碱基的C7位)的附接点。
在一些实施方案中,本文所述的核苷酸是完全官能化核苷酸(ffN),其包含本文所述的3′-OH封端基团和通过本文所述的可裂解接头共价附接到核碱基的染料化合物,其中可裂解接头包含具有结构 的L1,并且*指示L1与核碱基(例如,胞嘧啶、胸腺嘧啶或尿嘧啶碱基的C5位,或者7-脱氮腺嘌呤或7-脱氮鸟嘌呤的C7位)的附接点。在一些情况下,本文所述的具有烯丙胺或烯丙酰胺接头部分的ffN也称为ffN-DB或ffN-(DB),其中“DB”是指接头部分中的双键。在一些情况下,使用其中一种或多种ffN为ffN-DB的ffN集合(包括ffA、ffT、ffC和ffG)进行的测序运行提供了与本文所述的具有炔丙胺或炔丙酰胺接头部分的ffN集合(也称为ffN-PA或ffN-(PA))相比更高的ffN掺入速率。例如,本文所述的具有烯丙胺或烯丙酰胺接头部分和3′-AOM封端基团的ffN-DB集合相比于具有3′-O-叠氮甲基封端基团的ffN-PA集合,在相同条件下处理相同的时间段时,可以将掺入速率至少提高5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%或500%,从而改进定相值。在其他实施方案中,通过基底(例如,流通池或cBot系统)表面上的表面动力学Vmax测量掺入速率/速度。例如,具有3′-AOM封端基团的ffN-DB集合相比于具有3′-O-叠氮甲基封端基团的ffN-PA集合,在相同条件下处理相同的时间段时,可以将Vmax值(ms-1)至少提高5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%或500%。在一些实施方案中,在环境温度或低于环境温度的温度(诸如4至10℃)下测量掺入速率/速度。在其他实施方案中,在升高的温度(诸如40℃、45℃、50℃、55℃、60℃或65℃)下测量掺入速率/速度。在一些此类实施方案中,在碱性pH环境(例如,pH 9.0、9.2、9.4、9.6、9.8或10.0)的溶液中测量掺入速率/速度。在一些此类实施方案中,在酶诸如聚合酶(例如,DNA聚合酶)、末端脱氧核苷酸转移酶或逆转录酶的存在下测量掺入速率/速度。在一些实施方案中,ffN-DB为ffT-DB、ffC-DB或ffA-DB。在一个实施方案中,本文所述的具有改进的定相值的ffN-DB集合包括ffT-DB、ffC、ffA和ffG。在另一个实施方案中,本文所述的具有改进的定相值的ffN-DB集合包括ffT-DB、ffC-DB、ffA和ffG。在又一个实施方案中,本文所述的具有改进的定相值的ffN-DB集合包括ffT-DB、ffC-DB、ffA-DB和ffG。
在另外一些实施方案中,当本文所述核苷酸的核碱基为胸腺嘧啶或其任选地取代的衍生物和类似物(即核苷酸为T)时,L1包含烯丙胺部分或烯丙酰胺部分,或者它们的任选地取代的变体。在特定示例中,L1包括或为并且*指示L1与胸腺嘧啶碱基的C5位的附接点。在一些实施方案中,本文所述的T核苷酸是通过可裂解接头用染料分子标记的完全官能化T核苷酸(ffT),该可裂解接头包括 直接附接到胸腺嘧啶碱基的C5位(即,ffT-DB)。在一些情况下,当在测序应用中在钯催化剂的存在下使用ffT-DB时,它可以显著地改进测序指标,诸如定相、预定相和错误率。例如,当使用本文所述的具有3′-AOM封端基团的ffT-DB时,与使用具有3′-O-叠氮甲基封端基团的标准ffT-PA时的情况相比,该ffT-DB可以将本文所述的一种或多种测序指标至少改进50%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%、2000%、2500%或3000%。
本文所述核苷或核苷酸的另外一些实施方案包括具有式(Ia)、(Ia′)、(Ib)、(Ic)、(Ic′)或(Id)的那些:
在本文所述核苷或核苷酸的另外一些实施方案中,L2存在,并且L2包括 其中n和m各自独立地为整数1、2、3、4、5、6、7、8、9或10,并且苯基部分任选地被取代。在一些此类实施方案中,n为5,并且L2的苯基部分为未取代的。在另外一些实施方案中,m为4。
在本文所述核苷或核苷酸的任何实施方案中,可裂解接头或L1/L2还可以包含二硫化物部分或叠氮基部分(诸如),或者它们的组合。可以掺入L1或L2中的接头部分的附加的非限制性示例包括:
附加的接头部分公开于WO 2004/018493和美国专利公布号2016/0040225中,这两份专利以引用方式并入本文。
在本文所述核苷或核苷酸的任何实施方案中,核苷或核苷酸包含2′脱氧核糖部分(即,式(I)和(Ia)至(Id)中的R4为H)。在另外一些方面,该2′脱氧核糖在糖环的5′位含有一个、两个或三个磷酸基团。在另外一些方面,本文所述的核苷酸为核苷酸三磷酸(即,式(I)和(Ia)至(Id)中的R6形成三磷酸酯)。
在本文所述核苷或核苷酸的任何实施方案中,可检测标记可以包括荧光染料。
本公开的附加实施方案涉及包含本文所述核苷或核苷酸的寡核苷酸或多核苷酸。例如,其中掺入式(Ia′)的核苷酸的寡核苷酸或多核苷酸包含以下结构:
在一些此类实施方案中,该寡核苷酸或多核苷酸与模板或目标多核苷酸杂交。在一些此类实施方案中,模板多核苷酸被固定在固体载体上。
本公开的附加实施方案涉及固体载体,其包括多个固定的模板或目标多核苷酸的阵列,此类固定的模板或目标多核苷酸的至少一部分与包含本文所述核苷或核苷酸的寡核苷酸或多核苷酸杂交。
在本文所述核苷酸或核苷的任何实施方案中,3′-OH封端基团和可裂解接头(以及附接的标记)可以能够在相同或基本上相同的化学反应条件下除去,例如,3′-OH封端基团和可检测标记可以在单个化学反应中除去。在其他实施方案中,3′-OH封端基团和可检测标记在两个分开的步骤中除去。
在一些实施方案中,与用现有技术公开的标准3′-OH封端基团(例如3′-O-叠氮甲基保护基团)保护的相同核苷酸或核苷相比,本文所述的3′封端核苷酸或核苷在储存期间或在测序应用的试剂处理期间,以溶液形式或冻干形式提供了优异的稳定性。例如,本文公开的缩醛封端基团相比于受叠氮甲基保护的3′-OH,在相同条件下处理相同的时间段时,可以将稳定性至少提高5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%、2000%、2500%或3000%,从而降低预定相值并使得测序读段长度变长。在一些实施方案中,在环境温度或低于环境温度的温度(诸如4至10℃)下测量稳定性。在其他实施方案中,在升高的温度(诸如40℃、45℃、50℃、55℃、60℃或65℃)下测量稳定性。在一些此类实施方案中,在碱性pH环境(例如,pH 9.0、9.2、9.4、9.6、9.8或10.0)的溶液中测量稳定性。在一些此类实施方案中,在存在或不存在酶的情况下测量稳定性,其中酶诸如聚合酶(例如,DNA聚合酶)、末端脱氧核苷酸转移酶或逆转录酶。
在一些实施方案中,与用现有技术公开的标准3′-OH封端基团(例如3′-O-叠氮甲基保护基团)保护的相同核苷酸或核苷相比,本文所述的3′封端核苷酸或核苷在测序应用的化学裂解步骤期间在溶液中提供了优异的解封速率。例如,本文公开的缩醛封端基团相比于受叠氮甲基保护的3′-OH,在使用标准解封试剂(诸如三(羟丙基)膦)时,可以将解封速率至少提高5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%或2000%,从而缩短测序循环的总时间。在一些实施方案中,在环境温度或低于环境温度的温度(诸如4至10℃)下测量解封速率。在其他实施方案中,在升高的温度(诸如40℃、45℃、50℃、55℃、60℃或65℃)下测量解封速率。在一些此类实施方案中,在碱性pH环境(例如,pH 9.0、9.2、9.4、9.6、9.8或10.0)的溶液中测量解封速率。在一些此类实施方案中,解封试剂与底物(即,3′封端的核苷或核苷酸)的摩尔比为约10:1、约5:1、约2:1或约1:1。
在一些实施方案中,钯解封试剂(例如,Pd(0))用于除去3′缩醛封端基团(例如,AOM封端基团)。Pd可以与AOM基团的两个氧原子以及烯丙基基团的双键形成螯合络合物,使得直接邻近该官能团的解封试剂被除去,并可以使解封速率加快。例如,在Pd将本文所述具有式(Ia)、(Ia′)、(Ib)、(Ic)、(Ic′)或(Id)的掺入的核苷酸的接头和3′封端基团裂解之后,拷贝多核苷酸上的剩余接头构建体可以包含以下结构:
波形线是指氧与拷贝多核苷酸链的剩余磷酸二酯键的连接。例如,
烯丙基酰氨基或炔丙基酰氨基部分可以进一步被Pd催化剂裂解。此外,附接到可检测标记的剩余接头构建体具有以下结构:
例如
可裂解接头的裂解条件
本文所述的可裂解接头可以在各种化学条件下除去或裂解。非限制性裂解条件包括在水溶性膦配体例如三(羟丙基)膦(THP或THPP)或三(羟甲基)膦(THMP)存在下的钯催化剂,诸如Pd(II)络合物(例如,Pd(OAc)2、氯化烯丙基钯(II)二聚体[(烯丙基)PdCl]2或Na2PdCl4)。在一些实施方案中,3′缩醛封端基团可以在与用于可裂解接头的裂解条件相同或基本上相同的裂解条件下裂解。
钯催化剂
在一些实施方案中,本文所述的3′缩醛封端基团和可裂解接头可以通过钯催化剂裂解。在一些此类实施方案中,Pd催化剂是水溶性的。在一些此类实施方案中,Pd催化剂为Pd(0)络合物(例如,三(3,3′,3″-次膦基三(苯磺酸基)钯(0)九钠盐九水合物)。在一些情况下,Pd(0)络合物可以通过试剂诸如烯烃、醇、胺、膦或金属氢化物还原Pd(II)络合物而原位生成。合适的钯源包括Pd(CH3CN)2Cl2、[PdCl(烯丙基)]2、[Pd(烯丙基)(THP)]Cl、[Pd(烯丙基)(THP)2]Cl、Pd(OAc)2、Pd(PPh3)4、Pd(dba)2、Pd(Acac)2、PdCl2(COD)和Pd(TFA)2。在一个此类实施方案中,Pd(0)络合物由Na2PdCl4原位产生。在另一个实施方案中,钯源为烯丙基氯化钯(II)二聚体[(烯丙基)PdCl]2或[PdCl(C3H5)]2。在一些实施方案中,Pd(0)催化剂通过将Pd(II)络合物与膦混合而在水溶液中产生。合适的膦包括水溶性膦,诸如三(羟丙基)膦(THP)、三(羟甲基)膦(THMP)、1,3,5-三氮杂-7-磷杂金刚烷(PTA)、双(对磺酸基苯基)苯基膦二水合物钾盐、三(羧乙基)膦(TCEP)和三苯基膦-3,3',3'-三磺酸三钠盐。
在一些实施方案中,钯催化剂通过将[(烯丙基)PdCl]2与THP原位混合来制备。[(烯丙基)PdCl]2和THP的摩尔比可以为约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一个实施方案中,[(烯丙基)PdCl]2和THP的摩尔比为1:10。在一些其他实施方案中,钯催化剂通过将水溶性Pd试剂Na2PdCl4与THP原位混合来制备。Na2PdCl4和THP的摩尔比可以为约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一个实施方案中,Na2PdCl4和THP的摩尔比为约1:3。在另一个实施方案中,Na2PdCl4和THP的摩尔比为约1:3.5。在一些另外的实施方案中,可以添加一种或多种还原剂,诸如抗坏血酸或其盐(例如,抗坏血酸钠)。在一些实施方案中,裂解混合物可以含有附加的缓冲液试剂,诸如伯胺、仲胺、叔胺、天然氨基酸、非天然氨基酸、碳酸盐、磷酸盐或硼酸盐,或者它们的组合。在另外一些实施方案中,缓冲液试剂包括乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸钠、磷酸钠、硼酸钠、二甲基乙醇胺(DMEA)、二乙基乙醇胺(DEEA)、N,N,N′,N′-四甲基乙二胺(TMEDA)、N,N,N′,N′-四乙基乙二胺(TEEDA)或2-哌啶乙醇,或者它们的组合。在一个实施方案中,一种或多种缓冲液试剂包括DEEA。在另一个实施方案中,一种或多种缓冲液试剂含有一种或多种无机盐,诸如碳酸盐、磷酸盐或硼酸盐,或者它们的组合。在一个实施方案中,无机盐为钠盐。
在其他实施方案中,可裂解接头的裂解条件不同于3′-OH封端基团的裂解条件。例如,此外,当3′封端基团为3′-O-叠氮甲基时,–CH2N3部分可以通过膦转化为氨基基团。替代性地,可以将–CH2N3中的叠氮基基团转化为氨基基团,手段是通过使这些分子与硫醇,特别是水溶性硫醇诸如二硫苏糖醇(DTT)接触。在一个实施方案中,膦为THP。
与线性化相容
为了使核酸测序反应的通量最大化,有利的是能够并行对多个模板分子测序。可通过使用核酸阵列技术来实现多个模板的并行处理。这些阵列通常由固定到固体载体材料上的多核苷酸的高密度矩阵组成。
WO 98/44151和WO 00/18957均描述了核酸扩增方法,其允许将扩增产物固定在固体载体上以便形成阵列,这些阵列由簇或“集落”组成,其中簇或“集落”由多条相同的固定化多核苷酸链和多条相同的固定化互补链形成。这种类型的阵列在本文中被称为“成簇阵列”。在根据这些方法制备的聚类阵列上的DNA集落中存在的核酸分子可提供用于测序反应的模板,例如如WO 98/44152中所述。固相扩增反应的产物(诸如WO98/44151和WO 00/18957中描述的那些)是所谓的“桥接”结构,这些结构通过对成对的固定化多核苷酸链和固定化互补链(两条链均在5′端附接到固体载体上)进行退火而形成。为了提供更适合的模板用于核酸测序,优选的是除去“桥接”结构的其中一条固定化链的基本上全部或至少一部分,以便产生至少部分是单链的模板。因此,该模板的单链部分将可用于与测序引物杂交。除去“桥接”双链核酸结构中的一条固定化链的全部或一部分的过程被称为“线性化”。线性化的方式有多种,包括但不限于酶促裂解、光化学裂解或化学裂解。线性化方法的非限制性示例公开于PCT公开号WO 2007/010251、美国专利公布号2009/0088327、美国专利公布号2009/0118128和美国专利公布号2019/0352327中,这些专利全文以引用方式并入。
特别地,扩增(例如,桥式扩增或排他性扩增)形成由簇或“集落”组成的阵列,其中簇或“集落”由多条相同的固定化目标多核苷酸链和多条相同的固定化互补链形成。目标链和互补链形成至少部分是双链的多核苷酸复合物,其中两条链在它们的5′端固定到固体载体。使双链多核苷酸与钯催化剂的水溶液接触,该钯催化剂在包含经烯丙基修饰的核苷(例如,经烯丙基修饰的T核苷)的裂解位点处将一条链裂解,以除去其中一条固定化链的至少一部分,从而产生至少部分是单链的模板。因此,该模板的单链部分将可用于与测序引物杂交,以引发第一轮SBS(读段1)。在一些实施方案中,经烯丙基修饰的核苷位于P5引物序列中。该方法被称为第一化学线性化,与之相比的是标准酶促线性化,其中通过使用酶USER将P5引物上的U位裂解的酶促裂解反应来促进这种去除或裂解。
在一些实施方案中,用于裂解可裂解接头以及/或者3′-OH封端基团脱保护或除去3′-OH封端基团的条件也与这些线性化方法相容。在另外一些实施方案中,这种裂解条件与包括使用Pd络合物和膦的化学线性化方法相容。在一些实施方案中,Pd络合物是Pd(II)络合物(例如,Pd(OAc)2、[(烯丙基)PdCl]2或Na2PdCl4),其在膦(例如,THP)存在下原位产生Pd(0)。使用Pd催化剂将P5引物序列中的经烯丙基修饰的T核苷裂解的化学线性化方法详细描述于美国专利公布号2019/0352327中,该专利公布全文以引用方式并入。在另外的实施方案中,本文公开的Pd裂解混合物(例如,[Pd(烯丙基)Cl)2]和THP的含有DEEA的缓冲溶液)可以直接用于第一化学线性化步骤中。试剂数量减少使得能够进一步简化仪器(流道和卡盒)。
除非另外指明,否则提及核苷酸也旨在适用于核苷。
标记的核苷酸
根据本公开的一个方面,所描述的3′-OH封端核苷酸还包括可检测标记,这种核苷酸被称为标记核苷酸或完全官能化核苷酸(ffN)。标记(例如,荧光染料)通过多种方式经由可裂解接头缀合,这些方式包括疏水吸引、离子吸引和共价连接。在一些方面,染料通过经由可裂解接头实现的共价连接来缀合至核苷酸。在一些情况下,此类标记的核苷酸也被称为“经修饰的核苷酸”。本领域的普通技术人员理解,该标记可以通过使该标记的官能团(例如,羧基)与接头的官能团(例如,氨基)反应来共价结合到接头。
标记的核苷和核苷酸可用于标记通过诸如(以非限制性示例的方式)在PCR扩增、等温扩增、固相扩增、多核苷酸测序(例如,固相测序)、切口平移反应等中的酶促合成形成的多核苷酸。
在一些实施方案中,染料可以经由核苷酸碱基共价附接到寡核苷酸或核苷酸。例如,标记的核苷酸或寡核苷酸可以具有通过可裂解接头部分附接到嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位的标记。
除非另外指明,否则提及核苷酸也旨在适用于核苷。本申请还将参考DNA进一步描述,然而该描述也将适用于RNA、PNA和其他核酸,除非另外指明不适用。
核苷和核苷酸可以在糖或核碱基上的位点处标记。如本领域所知的,“核苷酸”由含氮碱基、糖和一个或多个磷酸基团组成。在RNA中,糖为核糖,而在DNA中,糖为脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮碱基是嘌呤或嘧啶的衍生物。嘌呤为腺嘌呤(A)和鸟嘌呤(G),并且嘧啶为胞嘧啶(C)和胸腺嘧啶(T),或在RNA的情况下为尿嘧啶(U)。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。核苷酸也是核苷的磷酸酯,其中酯化发生在附接到糖的C-3或C-5的羟基基团上。核苷酸通常是单磷酸、二磷酸或三磷酸。
“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团连接到糖分子的核苷类似物。
虽然碱基通常被称为嘌呤或嘧啶,但是技术人员将理解,可获得不改变核苷酸或核苷经历Watson-Crick碱基配对的能力的衍生物和类似物。“衍生物”或“类似物”意味着这样的化合物或分子:其核心结构与母体化合物的核心结构相同或非常类似,但其具有允许衍生的核苷酸或核苷与另一分子连接的化学或物理修饰,诸如不同的或附加的侧基。例如,碱基可以为脱氮嘌呤。在特定实施方案中,衍生物应当能够经历Watson-Crick配对。“衍生物”和“类似物”还包括例如具有经修饰的碱基部分和/或经修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键、亚磷酰胺键等。
在特定实施方案中,标记的核苷或核苷酸可以是可酶促掺入的和可酶促延伸的。因此,连接基部分可以具有足够的长度以将核苷酸连接到化合物,使得该化合物不显著干扰核酸复制酶对核苷酸的总体结合与识别。因此,连接基还可以包含间隔区单元。间隔区距离为例如核苷酸碱基距裂解位点或标记的距离。
本公开还涵盖掺入了染料化合物的多核苷酸。此类多核苷酸可以为分别由以磷酸二酯键接合的脱氧核糖核苷酸或核糖核苷酸组成的DNA或RNA。多核苷酸可以包含与如本文示出的至少一种经修饰的核苷酸(例如,用染料化合物标记)组合的天然存在的核苷酸、除本文所述的标记的核苷酸之外的非天然存在的(或经修饰的)核苷酸或它们的任何组合。根据本公开的多核苷酸还可以包括非天然的骨架键和/或非核苷酸化学修饰。还设想了由包含至少一种标记的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物组成的嵌合结构。
如本文所述的非限制性示例性标记核苷酸包括:
其中L表示可裂解接头(任选地包括本文所述的L2),R表示如上所述的核糖或脱氧核糖部分,或者5’位被一个、两个或三个磷酸取代的核糖或脱氧核糖部分。
在一些实施方案中,非限制性示例性荧光染料缀合物如下所示:
其中PG代表本文所述的3′-OH封端基团;n为整数1、2、3、4、5、6、7、8、9或10;k为0、1、2、3、4或5。在一个实施方案中,–O–PG是AOM。在另一个实施方案中,–O–PG为–O–叠氮甲基。在一个实施方案中,n为5。是指作为连接基部分的氨基与染料的羧基基团之间的反应的结果的染料与可裂解连接基的连接点。
测序方法
根据本公开的标记核苷酸或核苷可以用于任何分析方法(诸如包括检测附接到核苷酸或核苷的荧光标记的方法)中,无论是以其本身使用,还是掺入较大的分子结构或缀合物中或者与较大的分子结构或缀合物相关联。在该语境中,术语“掺入多核苷酸中”可以意味着5’磷酸以磷酸二酯键与第二(经修饰或未经修饰的)核苷酸的3'-OH基团接合,该第二核苷酸本身可以形成较长多核苷酸链的一部分。本文阐述的核苷酸的3’端能够以磷酸二酯键或能够不以磷酸二酯键与另外的(经修饰或未经修饰的)核苷酸的5’磷酸接合。因此,在一个非限制性实施方案中,本公开提供了一种检测掺入多核苷酸中的核苷酸的方法,该方法包括:(a)将至少一种本公开的核苷酸掺入多核苷酸中,以及(b)通过检测来自附接到所述核苷酸的可检测标记(例如,荧光化合物)的荧光信号,来检测掺入该多核苷酸中的核苷酸。该方法可以包括:合成步骤(a),其中将根据本公开的一种或多种核苷酸掺入多核苷酸中;以及检测步骤(b),其中通过检测或定量测量掺入多核苷酸中的一种或多种核苷酸的荧光,来检测这些核苷酸。
本公开的附加方面包括一种在测序反应中制备与目标单链多核苷酸互补的生长中的多核苷酸的方法,该方法包括将本文所述的核苷酸掺入生长中的互补多核苷酸中,其中掺入该核苷酸防止任何后续核苷酸引入该生长中的互补多核苷酸中。
本公开的一些实施方案涉及一种用于确定目标单链多核苷酸的序列的方法,该方法包括:
(a)将包含本文所述的3′-OH封端基团(附接到3′氧基)和如本文所述的可检测标记的核苷酸(例如,dATP、dCTP、dGTP、dTTP或dUTP)掺入与目标多核苷酸链的至少一部分互补的拷贝多核苷酸链中;
(b)检测掺入该拷贝多核苷酸链中的核苷酸的身份;以及
(c)以化学方式从掺入该拷贝多核苷酸链中的核苷酸除去标记和3′-OH封端基团。
在一些实施方案中,该测序方法还包括(d)使用裂解后洗涤溶液将以化学方式除去的标记和3′-OH封端基团从拷贝多核苷酸链上洗掉。在一些此类实施方案中,在引入下一个互补核苷酸之前,将3′-OH封端基团和可检测标记除去。在一些实施方案中,洗涤步骤(d)还除去了未掺入的核苷酸。在其他实施方案中,该方法可以包括单独的洗涤步骤,用于在步骤(b)之前将未掺入的核苷酸从拷贝多核苷酸链上洗掉。
在一些实施方案中,重复步骤(a)至(d),直到确定目标多核苷酸链的该部分的序列。在一些此类实施方案中,重复步骤(a)至(d)至少50次、至少75次、至少100次、至少150次、至少200次、至少250次或至少300次。
掺入混合物
在本文所述方法的一些实施方案中,步骤(a)(也称为掺入步骤)包括使含有一种或多种核苷酸(例如,dATP、dCTP、dGTP、dTTP或dUTP)的混合物与拷贝多核苷酸/目标多核苷酸复合物在包含聚合酶和一种或多种缓冲剂的掺入溶液中接触。在一些此类实施方案中,聚合酶是DNA聚合酶,例如Pol 812、Pol 1901、Pol 1558或Pol 963。Pol 812、Pol 1901、Pol1558或Pol 963DNA聚合酶的氨基酸序列描述于例如美国专利公布号2020/0131484A1和2020/0181587A1中,这两份专利公布均以引用方式并入本文。在一些实施方案中,一种或多种缓冲剂包括伯胺、仲胺、叔胺、天然氨基酸或非天然氨基酸,或者它们的组合。在另外的实施方案中,缓冲剂包括乙醇胺或甘氨酸,或者它们的组合。在一个实施方案中,缓冲剂包括甘氨酸,或为甘氨酸。在一些实施方案中,在掺入混合物中使用甘氨酸与相同条件下的标准缓冲剂(诸如乙醇胺(EA))相比,可以改进定相值。例如,使用甘氨酸与在相同条件下使用乙醇胺相比,使定相值至少降低或减少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%或500%。在一些情况下,使用甘氨酸在具有至少50个循环的SBS测序运行中提供小于约0.15%、0.1%、0.09%、0.08%、0.07%、0.06%、0.05%、0.04%、0.03%、0.02%或0.01%的%定相值。在另外的实施方案中,使用甘氨酸在具有至少150个循环的SBS测序运行的读段1中提供小于约0.08%的%定相值。
裂解混合物
在本文所述方法的一些实施方案中,步骤(c)(也称为裂解步骤)包括使掺入的核苷酸和拷贝多核苷酸链与包含本文所述的钯催化剂的裂解溶液接触。在一些此类实施方案中,在反应的单个步骤中除去3′-OH封端基团和可检测标记。在一个这样的实施方案中,3′封端基团为AOM,可裂解接头包括AOL部分,这两者均在化学反应的单个步骤中除去或裂解。在另外一些实施方案中,裂解溶液(也称为裂解混合物)包含本文所述的Pd催化剂。
在另外一些实施方案中,Pd催化剂为Pd(0)催化剂。在一些此类实施方案中,Pd(0)通过将Pd(II)试剂与一种或多种膦配体原位混合来制备。在一些此类实施方案中,钯催化剂可以通过将[(烯丙基)PdCl]2与THP原位混合来制备。[(烯丙基)PdCl]2和THP的摩尔比可以为约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一个实施方案中,[(烯丙基)PdCl]2和THP的摩尔比为1:10(即,Pd:THP的摩尔比为1:5)。在一些其他实施方案中,钯催化剂可以通过将水溶性Pd(II)试剂Na2PdCl4与THP原位混合来制备。Na2PdCl4和THP的摩尔比可以为约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在一个实施方案中,Na2PdCl4和THP的摩尔比为约1:3。在另一个实施方案中,Na2PdCl4和THP的摩尔比为约1:3.5。Pd催化剂的其他非限制性示例包括Pd(CH3CN)2Cl2
在一些另外的实施方案中,可以添加一种或多种还原剂,诸如抗坏血酸或其盐(例如,抗坏血酸钠)。在一些实施方案中,裂解溶液可以含有一种或多种缓冲液试剂,诸如伯胺、仲胺、叔胺、碳酸盐、磷酸盐或硼酸盐,或者它们的组合。在另外一些实施方案中,缓冲液试剂包括乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸钠、磷酸钠、硼酸钠、二甲基乙醇胺(DMEA)、二乙基乙醇胺(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)、N,N,N′,N′-四乙基乙二胺(TEEDA)或2-哌啶乙醇,或者它们的组合。在一个实施方案中,缓冲液试剂包括DEEA,或为DEEA。在另一个实施方案中,缓冲剂含有一种或多种无机盐,诸如碳酸盐、磷酸盐或硼酸盐,或它们的组合。在一个实施方案中,无机盐为钠盐。在另外的实施方案中,裂解溶液含有钯(Pd)催化剂(例如,[(烯丙基)PdCl]2/THP或Na2PdCl4/THP)和一种或多种本文所述的缓冲液试剂(例如,叔胺诸如DEEA),并且具有约9.0至约10.0(例如,9.6或9.8)的pH。
在其他实施方案中,标记和3′封端基团在两个分开的化学反应中除去。在一些情况下,从掺入拷贝多核苷酸链中的核苷酸除去标记包括使包含掺入的核苷酸的拷贝链与含有本文所述Pd催化剂的第一裂解溶液接触。在一些情况下,从掺入拷贝多核苷酸链中的核苷酸除去3′-OH封端基团包括使包含掺入的核苷酸的拷贝链与第二裂解溶液接触。在一些此类实施方案中,第二裂解溶液含有一种或多种膦,诸如三烷基膦。三烷基膦的非限制性示例包括三(羟丙基)膦(THP)、三-(2-羧乙基)膦(TCEP)、三(羟甲基)膦(THMP)或三(羟乙基)膦(THEP)。在一个实施方案中,3′-OH封端基团为3′-O-叠氮甲基,第二裂解溶液含有THP。
在一些实施方案中,本文所述的裂解溶液也可以用于本文所述的在先化学线性化步骤中。特别地,通过钯催化裂解固定在固体载体上的双链多核苷酸的一条或多条第一链,从而产生单链(或至少部分是单链的)模板,该模板将可用于与测序引物杂交和随后的测序应用(例如,边合成边测序的第一轮(读段1)),由此实现对制备用于测序的成簇多核苷酸的化学线性化。在一些实施方案中,每个双链多核苷酸包含第一链和第二链。第一链通过延伸固定到固体载体的第一延伸引物来产生。在一些实施方案中,第一链包含能够被钯络合物(例如,Pd(0)络合物)裂解的裂解位点。在一个具体实施方案中,裂解位点位于第一链的第一延伸引物部分中。在一个另外的实施方案中,裂解位点包含具有烯丙基官能度的胸腺嘧啶核苷或核苷酸类似物。在本文所述方法的一些实施方案中,目标单链多核苷酸通过从双链多核苷酸以化学方式裂解互补链来形成。在另外的实施方案中,双链中的互补链和目标多核苷酸都在它们的5′端固定在固体载体上。在另外一些实施方案中,以化学方式裂解互补链在与以化学方式从掺入拷贝多核苷酸链中的核苷酸除去可检测标记和3′-OH封端基团(即,本文所述方法的步骤(c))相同的反应条件下进行。在一个实施方案中,第一化学线性化利用本文所述的同一种裂解混合物。
钯(Pd)清除剂
Pd有能力主要以其无活性的Pd(II)形式粘附在DNA上,这可能干扰DNA与聚合酶之间的结合,从而导致定相增加。在解封步骤之后,可以使用包含Pd清除剂化合物的裂解后洗涤组合物。例如,PCT公开号WO2020/126593公开了Pd清除剂(诸如3,3’-二硫代二丙酸(DDPA)和硫辛酸(LA))可以包含在扫描组合物和/或裂解后洗涤组合物中。在裂解后洗涤溶液中使用这些清除剂的目的是清除Pd(0)、将Pd(0)转化为无活性的Pd(II)形式,从而改善预定相值和测序指标、减少信号劣化,并且延长测序读段长度。
在本文所述方法的一些实施方案中,该方法的步骤(a)包括使核苷酸与拷贝多核苷酸链在包含聚合酶、至少一种钯清除剂和一种或多种缓冲剂的掺入溶液中接触。在一些实施方案中,掺入溶液中的Pd清除剂为Pd(0)清除剂。在一些此类实施方案中,Pd清除剂包括一个或多个独立地选自由以下项组成的组的烯丙基部分:–O-烯丙基、–S-烯丙基、–NR-烯丙基和–N+RR′-烯丙基,其中R为H、未取代的或取代的C1-C6烷基、未取代的或取代的C2-C6烯基、未取代的或取代的C2-C6炔基、未取代的或取代的C6-C10芳基、未取代的或取代的5至10元杂芳基、未取代的或取代的C3-C10碳环基,或者未取代的或取代的5至10元杂环基;并且R′为H、未取代的C1-C6烷基或取代的C1-C6烷基。
在一些此类实施方案中,掺入溶液中的Pd(0)清除剂包含一个或多个–O-烯丙基部分。在另外一些实施方案中,Pd(0)清除剂包括或为 或者它们的组合。另选的Pd(0)清除剂公开于美国序列号63/190983中,该专利全文以引用方式并入。
在一些实施方案中,包含一个或多个烯丙基部分的Pd(0)清除剂在掺入溶液中的浓度为约0.1mM至约100mM、0.2mM至约75mM、约0.5mM至约50mM、约1mM至约20mM,或约2mM至约10mM。在另外的实施方案中,Pd(0)清除剂的浓度为约0.5mM、1mM、1.5mM、2mM、2.5mM、3mM、3.5mM、4mM、4.5mM、5mM、5.5mM、6mM、6.5mM、7mM、7.5mM、8mM、8.5mM、9mM、9.5mM、10mM、12.5mM、15mM、17.5mM或20mM。在另外的实施方案中,掺入溶液的pH为约9至10。
在一些实施方案中,钯催化剂(在起始溶液中)与包含一个或多个烯丙基部分的钯清除剂的摩尔比为约1:100、1:50、1:20、1:10或1:5。
在本文所述方法的一些其他实施方案中,当进行一次或多次荧光测量以检测拷贝多核苷酸中掺入的核苷酸的身份时,本文所述的包含一个或多个烯丙基部分的Pd(0)清除剂在步骤(b)的扫描溶液中使用。在还有其他实施方案中,包含一个或多个烯丙基部分的Pd(0)清除剂可以存在于掺入溶液和扫描溶液两者中。
在本文所述方法的另外一些实施方案中,裂解后洗涤步骤在除去标记和3′封端基团之后使用。在一些此类实施方案中,一种或多种钯清除剂也在将标记和3′封端基团裂解之后的洗涤步骤中使用。在另外一些实施方案中,裂解后洗涤溶液中的一种或多种Pd清除剂包括Pd(II)清除剂。在一些此类实施方案中,钯清除剂包括异氰基乙酸酯(ICNA)盐、半胱氨酸或其盐,或者它们的组合。在一个实施方案中,钯清除剂包括或为异氰基乙酸钾或异氰基乙酸钠。在另一个实施方案中,钯清除剂包括或为半胱氨酸或其盐(例如,L-半胱氨酸或L-半胱氨酸HCl盐)。裂解后洗涤溶液中的钯清除剂的其他非限制性示例可以包括:异氰基乙酸乙酯、异氰基乙酸甲酯、N-乙酰基-L-半胱氨酸、乙基黄原酸钾(PEX或KS-C(=S)-OEt)、异丙基黄原酸钾、谷胱甘肽、硫辛酸、乙二胺四乙酸(EDTA)、亚氨基二乙酸、次氮基二乙酸、三巯基-S-三嗪、二甲基二硫代氨基甲酸酯、二硫苏糖醇、巯基乙醇、烯丙醇、炔丙醇、硫醇、叔胺和/或叔膦,或者它们的组合。
在另外的实施方案中,Pd(II)清除剂(诸如L-半胱氨酸)在裂解后洗涤溶液中的浓度为约0.1mM至约100mM、0.2mM至约75mM、约0.5mM至约50mM、约1mM至约20mM,或约2mM至约10mM。在另外的实施方案中,Pd(II)清除剂(诸如L-半胱氨酸)的浓度为约1mM、2mM、3mM、4mM、5mM、6mM、6.5mM、7mM、8mM、9mM、10mM、12.5mM、15mM、17.5mM或20mM。在一个实施方案中,Pd清除剂(诸如L-半胱氨酸或其盐)在裂解后洗涤溶液中的浓度为约10mM。
在本文所述方法的一些其他实施方案中,所有Pd清除剂(例如,Pd(0)清除剂和Pd(II)清除剂两者)都在掺入溶液和/或扫描溶液中,并且该方法不采用特定的裂解后洗涤步骤来除去任何痕量的剩余Pd物质。
在本文所述方法的一些实施方案中,使用Pd清除剂(例如,具有一个或多个烯丙基部分的Pd(0)清除剂)与在相同条件下且不使用钯清除剂的相同测序运行相比,可以使预定相值至少降低10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%或1000%。在一些此类实施方案中,Pd(0)清除剂可以在具有至少50个循环的SBS测序运行中将该测序运行的预定相值降低至小于约0.1%、0.09%、0.08%、0.07%、0.06%、0.05%、0.04%、0.03%、0.02%或0.01%。在一些实施方案中,预定相值是指在50个循环、75个循环、100个循环、125个循环、150个循环、200个循环、250个循环或300个循环之后测量的值。
在另外一些实施方案中,钯清除剂(例如,Pd(II)清除剂诸如L-半胱氨酸或其盐)与在相同条件下且不使用钯清除剂的相同测序运行相比,可以使预定相值或定相值至少降低10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%或1000%。在一些此类实施方案中,使用Pd清除剂在具有至少50个循环的SBS测序运行中提供小于约0.2%、0.15%、0.1%、0.09%、0.08%、0.07%、0.06%、0.05%、0.04%、0.03%、0.02%或0.01%的%定相值。在一些实施方案中,定相值是指在50个循环、75个循环、100个循环、125个循环、150个循环、200个循环、250个循环或300个循环之后测量的值。在另外的实施方案中,使用一种或多种Pd清除剂在具有至少150个循环的SBS测序运行的读段1中提供小于约0.05%的%定相值。
在一些实施方案中,本文所述的裂解后洗涤溶液还可以在检测步骤(即,本文所述方法中的步骤(b))之前的单独洗涤步骤中使用,以将来自步骤(a)的任何未掺入的核苷酸洗掉。
在另外一些实施方案中,用于掺入步骤(a)的核苷酸是完全官能化的A、C、T和G核苷酸三磷酸,其各自含有本文所述的3′封端基团(例如,3′-AOM)和可裂解接头(例如,含有AOL接头部分的可裂解接头)。在一些此类实施方案中,与用标准3′-O-叠氮甲基封端基团保护的相同核苷酸相比,本文的核苷酸在测序运行期间在溶液中提供优异的稳定性。例如,本文公开的3′缩醛封端基团相比于受叠氮甲基保护的3′-OH,在相同条件下处理相同的时间段时,可以将稳定性至少提高5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%、2000%、2500%或3000%,从而降低预定相值并使得测序读段长度变长。在一些实施方案中,在环境温度或低于环境温度的温度(诸如4至10℃)下测量稳定性。在其他实施方案中,在升高的温度(诸如40℃、45℃、50℃、55℃、60℃或65℃)下测量稳定性。在一些此类实施方案中,在碱性pH环境(例如,pH 9.0、9.2、9.4、9.6、9.8或10.0)的溶液中测量稳定性。在另外一些实施方案中,在超过50个、100个或150个SBS循环之后,采用本文所述3’封端核苷酸的预定相值小于约0.25、0.24、0.23、0.22、0.21、0.20、0.19、0.18、0.17、0.16、0.15、0.14、0.13、0.12、0.11、0.10、0.09、0.08、0.07、0.06或0.05。在另外一些实施方案中,在超过50个、100个或150个SBS循环之后,采用3’封端核苷酸的定相值小于约0.25、0.24、0.23、0.22、0.21、0.20、0.19、0.18、0.17、0.16、0.15、0.14、0.13、0.12、0.11、0.10、0.09、0.08、0.07、0.06或0.05。在一个实施方案中,每个ffN均含有3’-AOM基团。
在一些实施方案中,与用标准3′-O-叠氮甲基封端基团保护的相同核苷酸相比,本文所述的3′封端核苷酸在测序运行的化学裂解步骤期间在溶液中提供了优异的解封速率。例如,本文公开的3′缩醛(例如AOM)封端基团相比于受叠氮甲基保护的3′-OH,在使用标准解封试剂(诸如三(羟丙基)膦)时,可以将解封速率至少提高5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、300%、400%、500%、600%、700%、800%、900%、1000%、1500%或2000%,从而缩短测序循环的总时间。在一些实施方案中,每个核苷酸的解封时间缩短约5%、10%、20%、30%、40%、50%或60%。例如,在特定的化学反应条件下,3′-AOM和3′-O-叠氮甲基的解封时间分别为约4至5秒和约9至10秒。在一些实施方案中,AOM封端基团的半衰期(t 1/2)至少比叠氮甲基封端基团快1、2、3、4、5、6、7、8、9或10倍。在一些此类实施方案中,AOM的t1/2为约1分钟,而叠氮甲基的t1/2为约11分钟。在一些实施方案中,在环境温度或低于环境温度的温度(诸如4至10℃)下测量解封速率。在其他实施方案中,在升高的温度(诸如40℃、45℃、50℃、55℃、60℃或65℃)下测量解封速率。在一些此类实施方案中,在碱性pH环境(例如,pH 9.0、9.2、9.4、9.6、9.8或10.0)的溶液中测量解封速率。在一些此类实施方案中,解封试剂与底物(即,3′封端的核苷或核苷酸)的摩尔比为约10:1、约5:1、约2:1、约1:1、约1:2、约1:5或约1:10。在一个实施方案中,每个ffN均含有3’-AOM封端基团和AOL接头部分。
在本文所述方法的任何实施方案中,标记核苷酸为具有2′脱氧核糖的核苷酸三磷酸。在本文所述方法的任何实施方案中,目标多核苷酸链附接到固体载体,诸如流通池。
在一个实施方案中,至少一种核苷酸在合成步骤中通过聚合酶的作用被掺入多核苷酸中。在一些此类实施方案中,聚合酶可以是DNA聚合酶Pol 812或Pol 1901。然而,可以使用将核苷酸接合到多核苷酸的其他方法,诸如,以化学方式合成寡核苷酸,或者将标记的寡核苷酸与未标记的寡核苷酸连接。因此,当术语“掺入”关于核苷酸和多核苷酸使用时,可以涵盖通过化学方法以及酶促方法进行的多核苷酸合成。
在一个具体的实施方案中,进行了合成步骤,该合成步骤可以任选地包括将模板多核苷酸链与包含本公开的标记的3′封端核苷酸的反应混合物一起孵育。还可以在允许在退火到模板多核苷酸链的多核苷酸链上的游离3'-OH基团与核苷酸上的5’磷酸基团之间形成磷酸二酯键的条件下提供聚合酶。因此,合成步骤可以包括通过核苷酸与模板链的互补碱基配对来指导多核苷酸链的形成。
在这些方法的所有实施方案中,检测步骤可以在向其中掺入了标记核苷酸的多核苷酸链退火到模板链或目标链上时进行,或者在将这两条链分离的变性步骤之后进行。在合成步骤和检测步骤之间可以包括另外的步骤,例如化学反应步骤或酶促反应步骤,或者纯化步骤。具体地讲,可以分离或纯化掺入了标记的核苷酸的靶链,然后进一步加工或用于后续的分析。以举例的方式,在合成步骤中用如本文所述的核苷酸标记的目标多核苷酸随后可以用作标记的探针或引物。在其他实施方案中,本文阐述的合成步骤的产物可以经受进一步的反应步骤,如果需要,对这些后续步骤的产物进行纯化或分离。
用于合成步骤的合适条件将为熟悉标准分子生物学技术的人员所熟知。在一个实施方案中,合成步骤可以类似于标准引物延伸反应,该标准引物延伸反应在合适的聚合酶存在下使用核苷酸前体(包括如本文所述的核苷酸)形成与模板链互补的延伸目标链。在其他实施方案中,合成步骤本身可以形成产生标记的双链扩增产物的扩增反应的一部分,该标记的双链扩增产物由来源于目标多核苷酸链和模板多核苷酸链的复制的退火互补链组成。其他示例性合成步骤包括切口平移、链置换聚合、随机引发的DNA标记等。用于合成步骤的特别有用的聚合酶是能够催化如本文所阐述的核苷酸的掺入的聚合酶。可以使用多种天然存在的或经修饰的聚合酶。以举例的方式,热稳定聚合酶可以用于使用热循环条件进行的合成反应,而热稳定聚合酶可能不是等温引物延伸反应所期望的。能够掺入根据本公开的核苷酸的合适的热稳定聚合酶包括WO 2005/024010或WO 06/120433中描述的那些,这两份专利各自以引用方式并入本文。在较低温度诸如37℃处进行的合成反应中,聚合酶不必是热稳定聚合酶,因此对聚合酶的选择将取决于许多因素,诸如反应温度、pH、链置换活性等。
在具体的非限制性实施方案中,本公开涵盖以下方法:核酸测序、重新测序、全基因组测序、单核苷酸多态性评分、涉及当本文阐述的标记的核苷酸或核苷掺入多核苷酸中时对其进行检测的任何其他应用。受益于使用用包含荧光染料的核苷酸标记的多核苷酸的多种其他应用中的任一种应用可以使用用本文阐述的染料标记的核苷酸或核苷。
在一个具体实施方案中,本公开提供了根据本公开的标记核苷酸在多核苷酸边合成边测序(SBS)反应中的用途。合成测序通常涉及使用聚合酶或连接酶在5'至3'方向上将一个或多个核苷酸或寡核苷酸顺序添加至生长的多核苷酸链,以便形成与待测序的模板核酸互补的延伸多核苷酸链。存在于一个或多个添加的核苷酸中的碱基的身份可以在检测或“成像”步骤中测定。添加的碱基的身份可以在每个核苷酸掺入步骤之后测定。然后可以使用常规的Watson-Crick碱基配对规则来推断模板的序列。使用本文阐述的标记核苷酸来测定单个碱基的身份可能是有用的,例如,在单核苷酸多态性评分中,并且此类单碱基延伸反应在本公开的范围内。
在本公开的一个实施方案中,模板多核苷酸的序列通过检测本文所述的一个或多个3′封端核苷酸掺入与待测序的模板多核苷酸互补的新生链中的情况来确定,该检测过程通过检测附接到掺入的核苷酸的荧光标记来完成。模板多核苷酸的测序可以用合适的引物(或制备成发夹构建体,其将包含引物作为发夹的一部分)引发,并且新生链通过在聚合酶催化的反应中向引物的3'端添加核苷酸而以逐个方式延伸。
在具体实施方案中,不同的核苷酸三磷酸(A、T、G和C)中的每一者可以用独特的荧光团来标记,并且还在3’位处包含封端基团以防止不受控制的聚合。替代性地,四种核苷酸中的一种可以是未标记的(暗色)。聚合酶将核苷酸掺入到与模板多核苷酸互补的新生链中,并且封端基团防止核苷酸的进一步掺入。任何未掺入的核苷酸都可以被洗掉,并且来自每个掺入的核苷酸的荧光信号可以通过合适的装置(诸如使用激光激发和合适的发射滤光器的电荷耦合器件)以光学方式“读取”。然后可以同时或顺序地除去(脱保护)3'-封端基团和荧光染料化合物,以暴露新生链用于进一步掺入核苷酸。通常,将在每个掺入步骤之后确定所掺入的核苷酸的身份,但这不是严格必需的。类似地,美国专利号5,302,509(以引用方式并入本文)公开了对固定在固体载体上的多核苷酸进行测序的方法。
如上文所例示,该方法利用了在DNA聚合酶的存在下将荧光标记的3'-封闭的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的生长链中。聚合酶掺入与靶多核苷酸互补的碱基,但是被3'-封闭基团防止进一步添加。然后可以确定掺入的核苷酸的标记,并且通过化学裂解除去封闭基团以允许发生进一步的聚合。在合成测序反应中待测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板将通常包含具有游离的3'-OH基团的双链区域,该双链区域充当用于在测序反应中添加另外的核苷酸的引物或起始点。待测序模板的该区域将在互补链上悬垂该游离的3'-OH基团。待测序模板的该悬垂区域可以是单链的,但也可以是双链的,前提条件是在与待测序的模板链互补的链上存在“切口”,以提供用于引发测序反应的游离3'-OH基团。在此类实施方案中,测序可以通过链置换进行。在某些实施方案中,可以添加带有游离的3'-OH基团的引物,作为与待测序模板的单链区域杂交的单独组分(例如,短寡核苷酸)。替代性地,待测序的引物和模板链可以各自形成能够形成分子内双链体(诸如发夹环结构)的部分自身互补核酸链的一部分。发夹多核苷酸及其可以附接到固体载体的方法在PCT公开号WO 01/57248和WO 2005/047301中公开,这两份PCT公开各自以引用方式并入本文。核苷酸可以被连续地添加到生长引物,导致在5'至3'方向上合成多核苷酸链。可以确定已添加的碱基的性质,特别是但不必在每次添加核苷酸之后,从而提供核酸模板的序列信息。因此,将核苷酸掺入核酸链(或多核苷酸)中的方式为,经由与该核苷酸的5’磷酸基团形成磷酸二酯键而将该核苷酸接合到核酸链的游离3'-OH基团。
待测序的核酸模板可以是DNA或RNA,或者甚至是由脱氧核苷酸和核糖核苷酸组成的杂合分子。核酸模板可以包含天然存在的和/或非天然存在的核苷酸以及天然或非天然的骨架键,前提条件是这些不阻止测序反应中模板的复制。
在某些实施方案中,待测序的核酸模板可以经由本领域已知的任何合适的连接方法(例如,经由共价连接)附接到固体载体。在某些实施方案中,模板多核苷酸可以直接附接到固体载体(例如,基于二氧化硅的载体)。然而,在本公开的其他实施方案中,固体载体的表面能够以某种方式加以修饰,以便允许直接共价连接模板多核苷酸,或者通过水凝胶或聚电解质多层来固定模板多核苷酸,该水凝胶或聚电解质多层本身可以非共价地附接到固体载体。
边合成边测序的实施方案和替代方案
一些实施方案包括焦磷酸测序技术。焦磷酸测序检测当将特定的核苷酸掺入新生链中时无机焦磷酸盐(PPi)的释放(Ronaghi,M.、Karamohamed,S.、Pettersson,B.、Uhlen,M.和Nyren,P.(1996年),“Real-time DNA sequencing using detection ofpyrophosphate release.”,Analytical Biochemistry 242(1),84-9;Ronaghi,M.(2001)“Pyrosequencing sheds light on DNA sequencing.”Genome Res.,11(1),3-11;Ronaghi,M.、Uhlen,M.和Nyren,P.(1998)“A sequencing method based on real-timepyrophosphate.”Science 281(5375),363;美国专利号6,210,891、6,258,568和6,274,320,这些文献的公开内容全文以引用方式并入本文)。在焦磷酸测序中,释放的PPi可通过被腺苷三磷酸(ATP)硫酸化酶立即转化为ATP成来进行检测,并且通过荧光素酶产生的光子来检测所产生的ATP水平。待测序的核酸可附接到阵列中的特征部,并且可对阵列进行成像以捕获由于在阵列的特征部处掺入核苷酸而产生的化学发光信号。可在用特定核苷酸类型(例如,A、T、C或G)处理阵列后获得图像。在添加每种核苷酸类型后获得的图像将在阵列中哪些特征部被检测到方面不同。图像中的这些差异反映阵列上的特征部的不同序列内容。然而,每个特征部的相对位置将在图像中保持不变。可使用本文所述的方法存储、处理和分析图像。例如,在用每种不同核苷酸类型处理阵列后获得的图像可以与本文针对从用于基于可逆终止子的测序方法的不同检测通道获得的图像所例示的相同方式进行处理。
在另一种示例性类型的SBS中,通过逐步添加可逆终止子核苷酸来完成循环测序,这些可逆终止子核苷酸包含例如可裂解或可光漂白的染料标记,如例如WO 04/018497和美国专利号7,057,026所述,这两份专利的公开内容以引用方式并入本文。该方法由Solexa(现为Illumina,Inc.)商业化,在WO 91/06678和WO 07/123,744中也有所描述,这两份专利各自以引用方式并入本文。荧光标记终止子(其中不但终止可以逆转,而且荧光标记可以裂解)的可用性有利于高效的循环可逆终止(CRT)测序。聚合酶也可共工程化以有效地掺入这些经修饰的核苷酸并从这些经修饰的核苷酸延伸。
优选地,在基于可逆终止子的测序实施方案中,标记在SBS反应条件下基本上不抑制延伸。然而,检测标记可以是可移除的,例如通过裂解或降解移除。可在将标记掺入到阵列化核酸特征部中后捕获图像。在特定实施方案中,每个循环涉及将四种不同的核苷酸类型同时递送到阵列,并且每种核苷酸类型具有在光谱上不同的标记。然后可获得四个图像,每个图像使用对四个不同标记中的一个标记具有选择性的检测通道。替代性地,可以顺序地添加不同的核苷酸类型,并且可以在每个添加步骤之间获得阵列的图像。在此类实施方案中,每个图像将显示其中已掺入特定类型核苷酸的核酸特征。由于每个特征部的不同序列内容,不同特征部将存在于或不存在于不同图像中。然而,特征部的相对位置将在图像中保持不变。通过此类可逆终止子-SBS方法获得的图像可如本文所述进行存储、处理和分析。在图像捕获步骤后,可以除去标记,并且可以除去可逆终止子部分,以便进行核苷酸添加和检测的后续循环。已在特定循环中以及在后续循环之前检测到标记之后移除这些标记可提供减少循环之间的背景信号和串扰的优点。可用的标记和去除方法的示例在下文进行阐述。
一些实施方案可以利用少于四种不同的标记来检测四种不同的核苷酸。例如,可以利用结合的美国专利公布号2013/0079232的材料中所述的方法和系统来执行SBS。作为第一个示例,一对核苷酸类型可在相同波长下检测,但基于对中的一个成员相对于另一个成员的强度差异,或基于对中的一个成员的导致与检测到的该对的另一个成员的信号相比明显的信号出现或消失的变化(例如,通过化学改性、光化学改性或物理改性)来区分。作为第二个示例,四种不同核苷酸类型中的三种能够在特定条件下被检测到,而第四种核苷酸类型缺少在那些条件下可被检测到或在那些条件下被最低限度地检测到的标记(例如,由于背景荧光而导致的最低限度检测等)。可基于其相应信号的存在来确定前三种核苷酸类型掺入到核酸中,并且可基于任何信号的不存在或对任何信号的最低限度检测来确定第四核苷酸类型掺入到核酸中。作为第三示例,一种核苷酸类型可包括在两个不同通道中检测到的标记,而其他核苷酸类型在不超过一个通道中被检测到。上述三种例示性构型不被认为是互相排斥的,并且可以各种组合进行使用。组合所有三个示例的示例性实施方案是基于荧光的SBS方法,该方法使用在第一通道中检测到的第一核苷酸类型(例如,具有当由第一激发波长激发时在第一通道中检测到的标记的dATP),在第二通道中检测到的第二核苷酸类型(例如,具有当由第二激发波长激发时在第二通道中检测到的标记的dCTP),在第一通道和第二通道两者中检测到的第三核苷酸类型(例如,具有当被第一激发波长和/或第二激发波长激发时在两个通道中检测到的至少一个标记的dTTP),以及缺少在任一通道中检测到或最低限度地检测到的标记的第四核苷酸类型(例如,不具有标记的dGTP)。
此外,如并入的美国公布2013/0079232的材料中所述,可使用单个通道获得测序数据。在此类所谓的单染料测序方法中,标记第一核苷酸类型,但在生成第一图像之后移除标记,并且仅在生成第一图像之后标记第二核苷酸类型。第三核苷酸类型在第一图像和第二图像中都保留其标记,并且第四核苷酸类型在两个图像中均保持未标记。
一些实施方案可以利用边连接边测序技术。此类技术利用DNA连接酶掺入寡核苷酸并确定此类寡核苷酸的掺入。寡核苷酸通常具有与寡核苷酸杂交的序列中的特定核苷酸的同一性相关的不同标记。与其他SBS方法一样,可在用已标记的测序试剂处理核酸特征部的阵列后获得图像。每个图像将示出已掺入特定类型的标记的核酸特征部。由于每个特征部的不同序列内容,不同特征部将存在于或不存在于不同图像中,但特征部的相对位置将在图像中保持不变。通过基于连接的测序方法获得的图像可如本文所述进行存储、处理和分析。可以与本文所述的方法和系统一起使用的示例性SBS系统和方法在美国专利号6,969,488、6,172,218和6,306,597中有所描述,这些专利的公开内容全文以引用方式并入本文。
一些实施方案可以利用纳米孔测序(Deamer,D.W.和Akeson,M.“Nanopores andnucleic acids:prospects for ultrarapid sequencing.”Trends Biotechnol.18,147-151(2000);Deamer,D.和D.Branton,“Characterization of nucleic acids by nanoporeanalysis”,Acc.Chem.Res.35:817-825(2002);Li,J.、M.Gershow、D.Stein、E.Brandin和J.A.Golovchenko,“DNA molecules and configurations in a solid-state nanoporemicroscope”,Nat.Mater.,2:611-615(2003),这些文献的公开内容全文以引用方式并入本文)。在此类实施方案中,目标核酸穿过纳米孔。纳米孔可为合成孔或生物膜蛋白,诸如α-溶血素。当目标核酸穿过纳米孔时,可以通过测量孔的电导率的波动来识别每个碱基对。(美国专利号7,001,792;Soni,G.V.和Meller,“A.Progress toward ultrafast DNAsequencing using solid-state nanopores.”Clin.Chem.53,1996-2001(2007);Healy,K.,“Nanopore-based single-molecule DNA analysis.”,Nanomed.2,459-481(2007);Cockroft,S.L.、Chu,J.、Amorin,M.和Ghadiri,M.R.,“A single-molecule nanoporedevice detects DNA polymerase activity with single-nucleotide resolution.”,J.Am.Chem.Soc.130,818-820(2008),这些文献的公开内容全文以引用方式并入本文)。从纳米孔测序获得的数据可如本文所述进行存储、处理和分析。具体地,根据本文所述的光学图像和其他图像的示例性处理,可将数据如同图像那样进行处理。
测序方法的一些其他实施方案涉及在纳米球测序技术中使用本文所述的3′封端核苷酸,诸如美国专利号9,222,132中所述的那些,该专利的公开内容以引用方式并入本文。通过滚环扩增(RCA)过程,可以产生大量离散的DNA纳米球。然后将纳米球混合物分布到含有允许单个纳米球与每个位置相关联的特征的图案化载玻片表面上。在DNA纳米球产生过程中,将DNA片段化,然后使其与四个衔接子序列中的第一个连接。对模板进行扩增、环化,之后用II型内切核酸酶裂解。添加第二组衔接子,然后进行扩增、环化和裂解。对剩余的两个衔接子重复该过程。最终产物是具有四个衔接子的环状模板,每个衔接子由模板序列分开。文库分子经历滚环扩增步骤,产生大量称为DNA纳米球的多联体,这些多联体随后沉积在流通池上。Goodwin等人,“Coming of age:ten years of next-generationsequencing technologies,”Nat Rev Genet.2016;17(6):333-51。
一些实施方案可利用涉及DNA聚合酶活性的实时监测的方法。可以通过携带荧光团的聚合酶与γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用来检测核苷酸掺入(如例如美国专利号7,329,492和7,211,414中所述,这两份专利均以引用方式并入本文),或者可以用零模波导来检测核苷酸掺入(如例如美国专利号7,315,019中所述,该专利以引用方式并入本文),并且可以使用荧光核苷酸类似物和工程化聚合酶来检测核苷酸掺入(如例如美国专利号7,405,281和美国专利公布号2008/0108082中所述,这两份专利均以引用方式并入本文)。可以将照明限于表面拴系的聚合酶周围的z升规模体积,使得可以在低背景下观察荧光标记核苷酸的掺入情况(Levene,M.J.等人,“Zero-mode waveguidesfor single-molecule analysis at high concentrations.”,Science 299,682-686(2003);Lundquist,P.M.等人,“Parallel confocal detection of single molecules inreal time.”,Opt.Lett.33,1026-1028(2008);Korlach,J.等人,“Selective aluminumpassivation for targeted immobilization of single DNA polymerase molecules inzero-mode waveguide nano structures.”,Proc.Natl.Acad.Sci.USA 105,1176-1181(2008),这些文献的公开内容全文以引用方式并入本文)。通过此类方法获得的图像可如本文所述进行存储、处理和分析。
一些SBS实施方案包括检测在核苷酸掺入延伸产物时释放的质子。例如,基于对释放质子的检测的测序可以使用可从Ion Torrent(Guilford,CT,Life Technologies子公司)商购获得的电检测器和相关技术,或者在美国专利公布号2009/0026082、2009/0127589、2010/0137143和2010/0282617(所有这些专利公布均以引用方式并入本文)中所述的测序方法和系统。本文阐述的使用动力学排阻来扩增靶核酸的方法可以容易地应用于用于检测质子的基板。更具体地,本文阐述的方法可以用于产生用于检测质子的扩增子克隆群体。
上述SBS方法可以有利地以多种格式进行,使得同时操纵多个不同的目标核酸。在具体实施方案中,不同的目标核酸可以在共同的反应容器中或在特定基底的表面上处理。这允许以多种方式方便地递送测序试剂、移除未反应的试剂和检测掺入事件。在使用表面结合的目标核酸的实施方案中,目标核酸可以是阵列格式。在阵列格式中,目标核酸通常能够以在空间上可区分的方式结合到表面。目标核酸可以通过直接共价连接、附接到珠粒或其他粒子或者结合到附接至表面的聚合酶或其他分子来结合。阵列可以在每个位点(也称为特征)处包括目标核酸的单个拷贝,或者具有相同序列的多个拷贝可以存在于每个位点或特征处。多个拷贝可以通过扩增方法(诸如,如下文进一步详细描述的桥式扩增或乳液PCR)来产生。
本文阐述的方法可以使用具有密度为多种密度中的任一种密度的特征的阵列,这些密度包括例如:至少约10个特征/cm2、100个特征/cm2、500个特征/cm2、1,000个特征/cm2、5,000个特征/cm2、10,000个特征/cm2、50,000个特征/cm2、100,000个特征/cm2、1,000,000个特征/cm2、5,000,000个特征/cm2,或更高的密度。
本文阐述的方法的优点是它们并行提供了对多个靶核酸的快速且有效检测。因此,本公开提供了能够使用本领域已知的技术(诸如上文所例示的那些)来制备和检测核酸的整合系统。因此,本公开的整合系统可以包括能够将扩增试剂和/或测序试剂递送到一个或多个固定DNA片段的流体部件,该系统包括诸如泵、阀、贮存器、流体管线等的部件。流通池在整合系统中可以被配置用于和/或用于检测靶核酸。示例性流通池在例如美国专利公布号2010/0111768和美国专利申请号13/273,666中有所描述,这两份专利各自以引用方式并入本文。如针对流通池所例示的,整合系统的一个或多个流体部件可以用于扩增方法和检测方法。以核酸测序实施方案为例,整合系统的一个或多个流体部件可以用于本文阐述的扩增方法以及用于在测序方法(诸如上文例示的那些)中递送测序试剂。另选地,整合系统可包括单独的流体系统以执行扩增方法并执行检测方法。能够产生扩增核酸而且还能够确定核酸序列的整合测序系统的示例包括但不限于MiSeqTM平台(Illumina,Inc.,SanDiego,CA),以及在美国专利申请号13/273,666中描述的设备,该专利以引用方式并入本文。
其中多核苷酸已直接附接到基于二氧化硅的载体的阵列是例如在WO 00/06770(以引用方式并入本文)中所公开的那些,其中通过玻璃上的环氧侧基与多核苷酸上的内部氨基基团之间的反应将多核苷酸固定在玻璃载体上。此外,可以通过硫基亲核物质与固体载体的反应将多核苷酸附接到固体载体,例如,如WO 2005/047301(以引用方式并入本文)中所述。固体承载的模板多核苷酸的又一个示例为,其中模板多核苷酸附接到承载在基于二氧化硅的固体载体或其他固体载体上的水凝胶,例如,如WO 00/31148、WO 01/01143、WO02/12566、WO 03/014392、美国专利号6,465,178和WO 00/53812中所述,这些专利各自以引用方式并入本文。
模板多核苷酸可以固定于其上的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶描述于上文引用的参考文献和WO 2005/065814中,该专利以引用方式并入本文。可以使用的具体水凝胶包括WO 2005/065814和美国专利公布号2014/0079923中所述的那些。在一个实施方案中,水凝胶为PAZAM(聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺))。
DNA模板分子可以附接到珠粒或微粒,例如,如美国专利号6,172,218(以引用方式并入本文)中所述。与珠粒或微粒的附接可以用于测序应用。可以制备珠粒文库,其中每个珠粒包含不同的DNA序列。示例性文库及其产生方法描述于以下文献中:Nature,437,376-380(2005);Science,309,5741,1728-1732(2005),这些文献各自以引用方式并入本文。使用本文示出的核苷酸对此类珠粒的阵列进行测序在本公开的范围内。
待测序的模板可以形成固体载体上的“阵列”的一部分,在这种情况下,阵列可以采取任何方便的形式。因此,本公开的方法适用于所有类型的高密度阵列,包括单分子阵列、成簇阵列和珠粒阵列。本公开的标记核苷酸可以用于对基本上任何类型的阵列上的模板(包括但不限于通过将核酸分子固定在固体载体上而形成的那些)进行测序。
然而,本公开的标记核苷酸在对成簇阵列进行测序的背景中是特别有利的。在成簇阵列中,阵列上的不同区域(通常称为位点或特征)包含多个多核苷酸模板分子。一般来讲,所述多个多核苷酸分子不能通过光学手段单独地分辨,而是作为整体被检测到。取决于阵列的形成方式,阵列上的每个位点可以包含一个单独多核苷酸分子的多个拷贝(例如,该位点对于特定的单链核酸种类或双链核酸种类是同质的)或甚至少量不同多核苷酸分子的多个拷贝(例如,两个不同核酸种类的多个拷贝)。核酸分子的成簇阵列可以使用本领域中公知的技术产生。以举例的方式,WO 98/44151和WO 00/18957(各自并入本文)描述了扩增核酸的方法,其中模板和扩增产物均保持固定在固体载体上,以便形成由固定化核酸分子的簇或“集落”组成的阵列。根据这些方法制备的成簇阵列上存在的核酸分子是使用用本公开的染料化合物标记的核苷酸进行测序的合适模板。
本公开的标记核苷酸还可用于对单分子阵列上的模板进行测序。如本文所用的术语“单分子阵列”或“SMA”,是指分布(或排列)在固体载体上的多核苷酸分子群,其中任何单独的多核苷酸与该分子群的所有其他多核苷酸的间距使得有可能单独地分辨单独的多核苷酸分子。因此,在一些实施方案中,固定到固体载体的表面上的目标核酸分子能够通过光学手段来分辨。这意味着一个或多个不同的信号(每个信号代表一种多核苷酸)将出现在所用的特定成像装置的可分辨区域内。
可以实现单分子检测,其中阵列上的相邻多核苷酸分子之间的间距为至少100nm,更具体地讲至少250nm,还更具体地讲至少300nm,甚至更具体地讲至少350nm。因此,每个分子能够作为单分子荧光点来单独地分辨和检测,并且来自所述单分子荧光点的荧光也表现出单步光漂白。
术语“单独分辨的”和“单独分辨”在本文中用于规定,当可视化时,有可能将阵列上的一个分子与其相邻分子区分开。阵列上各个分子之间的间隔将部分地通过用于分辨各个分子的特定技术来确定。通过参考已公布的专利申请WO 00/06770和WO 01/57248将理解单分子阵列的一般特征,这两份专利申请各自以引用方式并入本文。虽然本公开的核苷酸的一种用途是用于边合成边测序反应,但这些核苷酸的效用却不限于此类方法。事实上,这些核苷酸可以有利地用于需要检测附接于掺入到多核苷酸中的核苷酸的荧光标记的任何测序方法。
特别地,本公开的标记核苷酸可以用于自动化荧光测序方案中,尤其是基于Sanger和同事的链终止测序方法的荧光染料-终止子循环测序。此类方法通常使用酶和循环测序将荧光标记的双脱氧核苷酸掺入引物延伸测序反应中。所谓的Sanger测序方法和相关方案(Sanger型)利用带有标记的双脱氧核苷酸的随机化链终止。
因此,本公开还涵盖下述标记核苷酸:这些标记核苷酸是在3’位和2’位处都缺少羟基基团的双脱氧核苷酸,此类双脱氧核苷酸适合在Sanger型测序方法等中使用。
应当理解,掺入了3’封端基团的本公开的标记核苷酸也可以用于Sanger方法和相关方案中,因为通过使用具有3'-OH封端基团的核苷酸可以实现与通过使用双脱氧核苷酸所实现的效果相同的效果:两者均防止掺入后续核苷酸。在根据本公开的并且具有3'封闭基团的核苷酸将用于Sanger型测序方法的情况下,应当理解,附接到核苷酸的染料化合物或可检测标记不需要经由可裂解的连接基连接,因为在掺入本公开的标记的核苷酸的每种情况下;随后不需要掺入核苷酸,因此不需要从核苷酸上除去标记。
在本文所述SBS方法的任何实施方案中,用于测序应用中的核苷酸是本文所述的3′封端核苷酸,例如,式(I)和(Ia)至(Id)的核苷酸。在任何实施方案中,3′封端核苷酸是核苷酸三磷酸。
在某些测序方法中,掺入的核苷酸是未标记的。在掺入后,通过使用含有一种或多种荧光染料的标记的亲和试剂,可以引入一种或多种荧光标记。例如,步骤(a)的掺入缓冲液中的四种不同类型的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)中的一种、两种、三种或每一种可以是未标记的。这四种类型的核苷酸(例如dNTP)中的每一种具有本文所述的3′-OH封端基团(例如3′-AOM),以确保仅单个碱基可以通过聚合酶添加到拷贝多核苷酸的3′端。在掺入未标记的核苷酸之后,引入与掺入的dNTP特异性结合的亲和试剂,以提供包含掺入的dNTP的标记的延伸产物。美国专利公布号2013/0079232中已公开未标记的核苷酸和亲和试剂在边合成边测序中的用途。本公开的使用未标记的核苷酸的改进测序方法可以包括以下步骤:
(a’-1)将包含本文所述3′-OH封端基团(附接到3′氧基)的未标记核苷酸(例如,dATP、dCTP、dGTP、dTTP或dUTP)掺入与目标多核苷酸链的至少一部分互补的拷贝多核苷酸链中,以产生延伸的拷贝多核苷酸;
(a’-2)使延伸的拷贝多核苷酸与一组亲和试剂在其中一种亲和试剂特异性地结合掺入的未标记核苷酸的条件下接触,以提供标记的延伸拷贝多核苷酸;
(b’)通过对标记的延伸拷贝多核苷酸进行一次或多次荧光测量,来检测掺入拷贝多核苷酸链中的核苷酸的身份;以及
(c’)以化学方式从延伸的拷贝多核苷酸除去可检测标记,并且从掺入拷贝多核苷酸链中的核苷酸除去3′-OH封端基团。
亲和试剂可以包括:可以与核苷酸的半抗原部分结合的小分子或蛋白质标签(诸如链霉抗生物素蛋白-生物素、抗DIG和DIG、抗DNP和DNP)、抗体(包括但不限于抗体的结合片段、单链抗体、双特异性抗体等)、适体、打结素(knottin)、Affimer蛋白,或者以合适的特异性和亲和力结合掺入的核苷酸的任何其他已知试剂。在另外的实施方案中,一种亲和试剂可以用相同荧光染料的多个拷贝来标记。在一些实施方案中,Pd催化剂还将标记的亲和试剂除去。例如,未标记的核苷酸的半抗原部分可以通过如本文所述的可裂解接头(例如,AOL接头)附接到核碱基,该可裂解接头可以通过Pd催化剂裂解。在一些实施方案中,该方法还包括本文所述的裂解后洗涤步骤(d)。在一些实施方案中,该方法还包括重复步骤(a’-1)至(c’)或(a’-1)至(d),直到确定目标多核苷酸链的至少一部分的序列。在一些实施方案中,重复该循环至少50次、至少100次、至少150次、至少200次、至少250次或至少300次。
试剂盒
本公开还提供了试剂盒,其包括本文所述的一种或多种3′封端的核苷和/或核苷酸,例如,式(I)和(Ia)至(Id)的3′封端核苷酸。此类试剂盒通常将包括至少一种具有可检测标记(例如荧光染料)的3′封端的核苷酸或核苷,以及至少一种另外的组分。所述另外的组分可以是在本文示出的方法中或在下文的实施例部分中识别的组分中的一种或多种组分。可以结合到本公开的试剂盒中的组分的一些非限制性示例在下文示出。在另外一些实施方案中,该试剂盒可以包括四种类型的标记核苷酸,即本文所述的完全官能化核苷酸(A、C、T和G),其中每种类型的核苷酸均包含本文所述的3′-AOM封端基团和AOL接头部分。在另外的实施方案中,G是未标记的,并且不包含AOL接头。在更进一步的实施方案中,剩余三种核苷酸(即,A、C和T)中的一种或多种核苷酸包含L1,其为烯丙胺或烯丙酰胺接头部分。在一个实施方案中,该试剂盒包括本文所述的未标记的ffG、标记的ffA、标记的ffC和标记的ffT-DB。在另一个实施方案中,该试剂盒包括本文所述的未标记的ffG、标记的ffA、标记的ffC-DB和标记的ffT-DB。
在一个具体实施方案中,试剂盒可以包括至少一种标记的3′封端核苷酸或核苷,以及标记的或未标记的核苷酸或核苷。例如,用染料标记的核苷酸可以与未标记的或天然的核苷酸和/或与荧光标记的核苷酸或它们的任何组合结合提供。核苷酸的组合可以作为独立的单独组分(例如,每个容器或管一个核苷酸类型)或作为核苷酸混合物(例如,在同一容器或管中混合的两种或更多种核苷酸)提供。
在试剂盒包括用染料化合物标记的多种,特别地是两种或三种,或者更特别地是四种3′封端核苷酸的情况下,不同的核苷酸可以用不同的染料化合物标记,或者一种可以是暗色的,未用染料化合物标记。在不同的核苷酸用不同的染料化合物标记的情况下,试剂盒的一个特征是染料化合物是光谱上可区分的荧光染料。如本文所用,术语“光谱上可区分的荧光染料”是指当一个样品中存在两种或更多种此类染料时,以能够通过荧光检测设备(例如,商业的基于毛细管的DNA测序平台)区分的波长发射荧光能量的荧光染料。当用荧光染料化合物标记的两种核苷酸以试剂盒形式提供时,一些实施方案的特征在于,光谱上可区分的荧光染料能够以相同的波长激发,诸如,通过相同的激光器激发。当用荧光染料化合物标记的四种3′封端核苷酸(A、C、T和G)以试剂盒形式提供时,一些实施方案的特征在于,光谱上可区分的荧光染料中的两种荧光染料均能够以一个波长激发,而另外两种光谱上可区分的染料均能够以另一个波长激发。特定激发波长为488nm和532nm。
在一个实施方案中,试剂盒包括用第一染料标记的第一3′封端核苷酸,以及用第二染料标记的第二核苷酸,其中这些染料具有至少10nm,特别是20nm至50nm的最大吸光度差。更具体地讲,这两种染料化合物具有介于15nm至40nm之间的斯托克斯位移,其中“斯托克斯位移”是峰值吸收波长和峰值发射波长之间的距离。
在一个另选的实施方案中,本公开的试剂盒可以包含其中相同的碱基用两种或更多种不同的染料标记的3′封端核苷酸。第一核苷酸(例如,3′封端的T核苷酸三磷酸或3′封端的G核苷酸三磷酸)可以用第一染料标记。第二核苷酸(例如,3′封端的C核苷酸三磷酸)可以用与第一染料在光谱上不同的第二染料标记,例如在小于600nm的波长下吸光的“绿色”染料,和在小于500nm的波长下吸光的“蓝色”染料,所述波长例如400nm至500nm,特别是450nm至460nm。第三核苷酸(例如,3′封端的A核苷酸三磷酸)可以标记为第一染料和第二染料的混合物,或者第一染料、第二染料和第三染料的混合物,并且第四核苷酸(例如,3′封端的G核苷酸三磷酸或3′封端的T核苷酸三磷酸)可以是“暗色”的,并且不包含标记。在一个示例中,核苷酸1至4可以被标记为“蓝色”、“绿色”、“蓝色/绿色”和暗色。为了进一步简化仪器,可以用单个激光器所激发的两种染料标记四种核苷酸,因此核苷酸1至4的标记可以是“蓝色1”、“蓝色2”、“蓝色1/蓝色2”和暗色。
在具体实施方案中,试剂盒可以包含四种标记的3′封端核苷酸(例如,A、C、T、G),其中每种类型的核苷酸包含相同的3’封端基团和荧光标记,并且其中每种荧光标记具有不同的最大荧光值,每种荧光标记能够与另外三种标记区分开。试剂盒可以是这样的:即,这些荧光标记中的两种或更多种荧光标记具有类似的最大吸光度,但具有不同的斯托克斯位移。在一些其他实施方案中,一种类型的核苷酸是未标记的。
尽管本文以具有用不同染料化合物标记的不同核苷酸的构型为例来说明试剂盒,但是应当理解,试剂盒可以包括具有相同染料化合物的2种、3种、4种或更多种不同核苷酸。在一些实施方案中,试剂盒还包括酶和适于酶发挥作用的缓冲液。在一些此类实施方案中,酶是聚合酶、末端脱氧核苷酸转移酶或逆转录酶。在具体实施方案中,酶是DNA聚合酶,诸如DNA聚合酶812(Pol 812)或DNA聚合酶1901(Pol 1901)。在另外一些实施方案中,试剂盒可以包括本文所述的掺入混合物。在另外的实施方案中,含有本文所述的掺入混合物的试剂盒还包括至少一种Pd清除剂(例如,本文所述的包含一个或多个烯丙基部分的Pd(0)清除剂)。Pd(0)清除剂包括一个或多个各自独立地选自由以下项组成的组的烯丙基部分:–O-烯丙基、–S-烯丙基、–NR-烯丙基和–N+RR′-烯丙基,其中R为H、未取代的或取代的C1-C6烷基、未取代的或取代的C2-C6烯基、未取代的或取代的C2-C6炔基、未取代的或取代的C6-C10芳基、未取代的或取代的5至10元杂芳基、未取代的或取代的C3-C10碳环基,或者未取代的或取代的5至10元杂环基;并且R′为H、未取代的C1-C6烷基或取代的C1-C6烷基。在一些此类实施方案中,掺入溶液中的Pd(0)清除剂包含一个或多个–O-烯丙基部分。在另外一些实施方案中,Pd(0)清除剂包括或为 或者它们的组合。另选的Pd(0)清除剂公开于美国序列号63/190983中,该专利全文以引用方式并入。在一个实施方案中,掺入混合物中的Pd(0)清除剂包括或为在另一个实施方案中,掺入混合物中的Pd(0)清除剂包括或为
待被包括在此类试剂盒中的其他组分可以包括缓冲液等。本公开的核苷酸以及包括不同核苷酸的混合物在内的其他任何核苷酸组分可以在试剂盒中以浓缩形式提供,在使用前稀释。在此类实施方案中,还可以包括合适的稀释缓冲液。例如,掺入混合物试剂盒可以包括一种或多种选自以下项的缓冲剂:伯胺、仲胺、叔胺、天然氨基酸或非天然氨基酸,或者它们的组合。在另外的实施方案中,掺入混合物中的缓冲剂包括乙醇胺或甘氨酸,或者它们的组合。
同样,在本文示出的方法中识别的组分中的一种或多种组分可以被包括在本公开的试剂盒中。在另外一些实施方案中,试剂盒可以包括本文所述的钯催化剂。在一些实施方案中,Pd催化剂通过将Pd(II)络合物(即Pd预催化剂)与本文所述的一种或多种水溶性膦混合来产生。在一些此类实施方案中,包含Pd催化剂的试剂盒是裂解混合物试剂盒。在另外的实施方案中,裂解混合物试剂盒可以包含[Pd(烯丙基)Cl]2或Na2PdCl4和水溶性膦THP,用于产生活性Pd(0)物质。Pd(II)络合物(例如[Pd(烯丙基)Cl]2或Na2PdCl4)与水溶性膦(例如THP)的摩尔比可以为约1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9或1:10。在另外的实施方案中,裂解混合物试剂盒还可以包含一种或多种选自由以下项组成的组的缓冲液试剂:伯胺、仲胺、叔胺、碳酸盐、磷酸盐、硼酸盐,以及它们的组合。裂解混合物试剂盒中的缓冲液试剂的非限制性示例选自由以下项组成的组:乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸盐、磷酸盐、硼酸盐、二甲基乙醇胺(DMEA)、二乙基乙醇胺(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)、N,N,N′,N′-四乙基乙二胺(TEEDA)、2-哌啶乙醇,以及它们的组合。在一个实施方案中,裂解混合物试剂盒包含DEEA。在其他实施方案中,裂解混合物试剂盒包含2-哌啶乙醇。
在另外一些实施方案中,试剂盒可以包括一种或多种钯清除剂(例如,本文所述的Pd(II)清除剂)。在一些此类实施方案中,试剂盒是裂解后洗涤缓冲液试剂盒。裂解后洗涤缓冲液试剂盒中的Pd清除剂的非限制性示例包括异氰基乙酸酯(ICNA)盐、异氰基乙酸乙酯、异氰基乙酸甲酯、半胱氨酸或其盐、L-半胱氨酸或其盐、N-乙酰基-L-半胱氨酸、乙基黄原酸钾、异丙基黄原酸钾、谷胱甘肽、硫辛酸、乙二胺四乙酸(EDTA)、亚氨基二乙酸、次氮基二乙酸、三巯基-S-三嗪、二甲基二硫代氨基甲酸酯、二硫苏糖醇、巯基乙醇、烯丙醇、炔丙醇、硫醇、叔胺和/或叔膦,或者它们的组合。在一个实施方案中,裂解后洗涤缓冲液试剂盒包括L-半胱氨酸或其盐。
在本文所述试剂盒的任何实施方案中,Pd清除剂(例如,本文所述的Pd(0)或Pd(II)清除剂)在与Pd催化剂分开的容器/隔室中。
实施例
在以下实施例中更详细地公开了附加的实施方案,这些实施例并非旨在以任何方式限制权利要求书的范围。
实施例1.合成具有3′AOM和AOL接头部分的完全官能化核苷酸
方案1.合成AOL接头部分
合成中间体AOL LN2
在N2下将缩醛化合物LN1(2.43g,9.6mmol)溶于无水CH2Cl2(100mL)中,用冰浴将该溶液冷却至0℃。添加2,4,6-三甲基吡啶(7.6mL,57.5mmol),然后滴加三氟甲磺酸三甲基硅酯(7.0mL,38.7mmol)。将混合物在0℃下搅拌2小时,然后添加烯丙醇(13L,191.1mmol),将反应物回流过夜。用MeOH/H2O的98:2混合物淬灭反应,在RT下将所得溶液再搅拌3小时。用CH2Cl2(100mL)和水(200mL)稀释混合物,用2N HCl将水层酸化至pH 2至3。分离水层,有机层另外用酸性水萃取。有机层用MgSO4干燥,过滤后减压蒸发挥发物。取粗产物通过硅胶快速色谱法纯化,得到AOL LN2,为无色油状物(2.56g,86%)。
合成中间体AOL LN3
向AOL LN2(2.17g,7.0mmol)的乙醇溶液(17.5mL)中添加4M NaOH(17.5mL,70mmol)水溶液,在RT下将混合物搅拌3小时。此后,减压除去所有挥发物,将残余物溶于75mL水中。用2N HCl将溶液酸化至pH 2-3,然后用二氯甲烷(DCM)萃取。合并的有机级分用MgSO4干燥,过滤后减压蒸发挥发物。不进一步纯化即获得AOL LN3,为无色油状物,在-20℃下储存时凝固(1.65g,84%)。LC-MS(ES):(负离子)m/z281(M-H+);(正离子)m/z 305(M+Na+)。
合成中间体AOL LN4
将AOL LN3(1.62g,5.74mmol)的无水DMF溶液(20mL)在真空下搅拌5分钟,然后用冰浴冷却至0℃。在N2下滴加N,N-二异丙基乙胺(1.2mL,6.89mmol),然后滴加PyBOP(3.30g,6.34mmol)。在0℃下将反应物搅拌30分钟,然后添加N-(5-氨基戊基)-2,2,2-三氟乙酰胺盐酸盐(1.62g,6.90mmol)的无水DMF溶液(3.0mL),之后立即添加额外的N,N-二异丙基乙胺(1.4mL,8.04mmol)。将反应物从冰浴中取出,在RT下搅拌4小时。减压除去挥发物,将残余物溶于EtOAc(150mL)中。用20mMKHSO4水溶液、水与饱和NaHCO3水溶液萃取该溶液。有机层用MgSO4干燥,过滤后减压蒸发挥发物。取粗产物通过硅胶快速色谱法纯化,得到AOL LN4,为无色油状物(2.16g,82%)。LC-MS(ES):(负离子)m/z 461(M-H+),497(M-Cl-)。
合成AOL接头部分
向AOL LN4(350mg,0.76mmol)的CH3CN溶液(13mL)中添加TEMPO(48mg,0.31mmol),之后添加NaH2PO4·2H2O(762mg,4.88mmol)和NaClO2(275mg,3.04mmol)的水溶液(6.5mL)。添加NaClO(14%有效氯,0.83mL,1.94mmol)水溶液,溶液立即变为深棕色。在RT下将反应物搅拌6小时,然后用100mM Na2S2O3水溶液淬灭,直到混合物变为无色。减压除去乙腈,取残余物用水稀释,然后用三乙胺碱化。用EtOAc(10mL)萃取水相,然后减压浓缩。取粗产物通过C18柱反相快速色谱法纯化,得到AOL,为无色油状物(三乙基铵盐,310mg,71%)。LC-MS(ES):(负离子)m/z 475(M-H+);(正离子)m/z499(M+Na+),578(M+Et3NH+)。
合成AOL-NH2接头部分
向AOL(446mg,0.94mmol)的甲醇溶液(10mL)中添加NH3水溶液(35%,40mL),将混合物在RT下搅拌5.5小时。此后,减压除去所有挥发物,取粗产物通过C18柱反相快速色谱法纯化,得到AOL NH2,为白色固体(定量)。1H NMR(400MHz,DMSO-d6):δ(ppm)8.86(t,J=5.5Hz,1H,CONH),8.28(s,3H,NH3 +),7.85(s,1H,Ar-H),7.41(d,J=7.6Hz,1H,Ar-H),7.31(t,J=7.9Hz,1H,Ar-H),7.03(ddd,J=8.1,2.5,1.1Hz,1H,Ar-H),5.87(ddt,J=17.2,10.5,5.3Hz,1H,OCH2CHCH2),5.24(dq,J=17.2,1.7Hz,1H,OCH2CHCH2,Ha),5.09(dq,J=10.5,1.5Hz,1H,OCH2CHCH2,Hb),5.02(dd,J=6.7,2.4Hz,1H,OCHO),4.41(dd,J=12.2,2.5Hz,1H,OCH2,Ha),4.18–3.99(m,3H,OCH2CHCH2和OCH2,Hb),3.94–3.81(m,2H,OCH2COOH),3.49–3.39(m,1H,CH2,Ha),3.21–3.10(m,1H,CH2,Hb),2.86–2.70(m,2H,CH2),1.81–1.39(m,6H,CH2)。13C NMR(101MHz,DMSO-d6):δ(ppm)172.9,166.1,158.0,136.2,135.2,129.3,120.4,119.3,116.0,111.3,99.0,68.8,67.7,66.8,38.7,38.4,27.8,26.3,23.0。LC-MS(ESI):(负离子)379(M-H);(正离子)m/z 381(M+H+)。
用于染料-AOL接头偶联的一般程序
将染料羧酸盐(0.15mmol)溶于6mL无水N,N’-二甲基甲酰胺(DMF)中。添加N,N-二异丙基乙胺(136μL,0.78mmol),之后添加N,N,N',N'-四甲基-O-(N-琥珀酰亚胺)脲四氟硼酸盐的0.5M无水DMF溶液(TSTU,300μL,0.15mmol)。在RT下,将反应物在氮气下搅拌1小时。将AOL NH2(0.10mmol)的水溶液(400μL)添加到活化的染料溶液中,在RT下将反应物搅拌3小时。取粗产物通过制备型RP-HPLC纯化。
AOL-SO7181的表征:收率54%(54μmol)。LC-MS(ES):(负离子)m/z 1002(M-H+);(正离子)m/z 1004(M+H+)。
AOL-AF550POPOS0的表征:收率88%(88μmol)。LC-MS(ES):(负离子)m/z 1034(M-H+),516(M-2H+);(正离子)m/z 1036(M+H+),1137(M+Et3NH+)。
AOL-NR7180A的表征:收率24%(23.9μmol)。LC-MS(ES):(正离子)m/z=880(M+H)+
AOL-NR550S0的表征:收率22%(21.9μmol)。LC-MS(ES):(正离子)m/z=963(M+H)+。(负离子)m/z=961(M-H+)。
方案2.合成5’-三磷酸-3’-AOM-A(DB)核苷酸
合成中间体A2
在N2气氛下将化合物A1(319mg,0.419mmol)溶于0.8mL无水DCM中,然后添加五甲基环戊二烯基三(乙腈)六氟磷酸钌(II)([RuCp*(MeCN)3]PF6,42mg,0.08mmol),之后添加三乙氧基硅烷(231μL,1.25mmol)。在RT下,将反应物在N2下搅拌1小时。然后用DCM将溶液稀释,在硅胶塞上过滤,用乙酸乙酯洗涤硅胶塞。减压蒸发溶液,使其在真空下干燥10分钟,然后将残余物溶于2mL无水THF中。添加碘化亚铜(15mg,0.08mmol)和1M TBAF的THF溶液(920μL,0.919mmol)。在RT下将反应物搅拌2.5小时,用EtOAc稀释后,再用饱和NH4Cl萃取。用EtOAc萃取水相。合并的有机相用MgSO4干燥,过滤后蒸发至干。取残余物通过硅胶快速色谱法纯化。收率:125mg(0.237mmol)。LC-MS(ES和CI):(正离子)m/z 527(M+H+)。
合成中间体A3
减压下将核苷A2(155mg,0.294mmol)用P2O5干燥18小时。在氮气下向其中添加无水磷酸三乙酯(1mL)和一些新活化的分子筛,然后在冰浴中将反应烧瓶冷却至0℃。滴加新蒸馏的POCl3(33μL,0.353mmol),之后滴加Proton(113mg,0.53mmol)。添加后,在0℃下将反应物进一步搅拌15分钟。然后,快速添加0.5M焦磷酸二-三正丁基铵盐(2.94mL,1.47mmol)的无水DMF溶液,之后立即添加三正丁基胺(294μL,1.32mmol)。将反应物在冰水浴中再保持10分钟,然后将其倒入1M三乙基碳酸氢铵水溶液(TEAB,10mL)中淬灭,在RT下搅拌4小时。减压蒸发所有溶剂。向上述残余物中添加35%氨水溶液(10mL),在RT下将混合物至少搅拌5小时。然后减压蒸发溶剂。首先在DEAE-Sephadex A25(50g)上通过离子交换色谱法纯化粗产物。用三乙基碳酸氢铵(TEAB)水溶液洗脱色谱柱。合并含有三磷酸的级分,减压蒸发溶剂至干。取粗料通过制备型HPLC进一步纯化。获得化合物A3,为三乙基铵盐。收率:134μmol(46%)。LC-MS(ESI):(负离子)m/z614(M-H+)。
此外,还制备了具有结构的5’-三磷酸-3’-AOM-A核苷酸和对应的ffA。详细的合成步骤描述于美国专利申请号16/724,088中。
核苷酸三磷酸-AOL接头的一般合成过程
将化合物AOL(0.120mmol)与2×2mL的无水N,N’-二甲基甲酰胺(DMF)共蒸发,然后溶于3mL无水N,N’-二甲基乙酰胺(DMA)中。添加N,N-二异丙基乙胺(70μL,0.4mmol),之后添加N,N,N',N'-四甲基-O-(N-琥珀酰亚胺)脲四氟硼酸盐(TSTU,36mg,0.120mmol)。在RT下,将反应物在氮气下搅拌1小时。与此同时,减压蒸发核苷酸三磷酸(0.08mmol)的水溶液至干,然后再悬浮于300μL的0.1M三乙基碳酸氢铵(TEAB)水溶液中。将活化的接头溶液添加到核苷酸三磷酸中,在RT下将反应物搅拌18小时,然后通过RP-HPLC监测。将溶液浓缩,然后添加10mL浓NH4OH水溶液。在RT下将反应物搅拌24小时,然后减压蒸发。首先在DEAE-SephadexA25(50g)上通过离子交换色谱法纯化粗产物,用三乙基碳酸氢铵(TEAB)水溶液洗脱。合并含有三磷酸的级分,减压蒸发溶剂至干。取粗料通过制备型HPLC进一步纯化。
pppA(DB)-(3’AOM)-AOL的表征:收率60μmol(75%)。LC-MS(ES):(负离子)m/z 976(M-H+),488(M-2H+)。
pppA(DB)-(3’AOM)-AOL的表征:收率68μmol(72%)。1H NMR(400MHz,D2O):δ(ppm)7.94(d,J=1.7Hz,1H,H-2),7.32(d,J=1.6Hz,1H,H-8),7.10–6.96(m,2H,Ar),6.95–6.87(m,2H,Ar),6.41–6.31(m,1H,1’-CH),6.01–5.81(m,2H,CH烯丙基),5.29(ddq,J=17.2,6.1,1.4Hz,2H,CHH烯丙基),5.20(ddt,J=10.5,3.8,1.1Hz,2H,CHH烯丙基),5.02(td,J=4.4,2.4Hz,1H,O-CH2-O接头),4.92–4.81(m,2H,3’-O-CH2-O),4.53(dd,J=4.9,2.4Hz,1H,3’-CH),4.39(dd,J=16.1,4.0Hz,1H,O-CHH接头),4.32–4.19(m,2H,O-CHH接头,4’-CH),4.17–4.01(m,8H,5’-CH2,CH2O接头,CH2-O烯丙基),3.25–3.11(m,2H,CH2-NHCO),3.04(q,J=7.3Hz,18H,Et3N),2.92–2.82(m,2H,CH2-N接头),2.55–2.41(m,2H,2’-CH2),1.59(p,J=7.6Hz,2H,CH2-CH2-N接头),1.47(p,J=7.1Hz,2H,CH2-CH2-NHCO),1.31(tt,J=8.3,4.4Hz,2H,CH2-CH2-CH2-N接头),1.15(t,J=7.3Hz,26H)。31P NMR(162MHz,D2O):δ(ppm)-6.18(d,J=20.6Hz,γP),-11.32(d,J=19.3Hz,αP),-22.20(t,J=19.9Hz,βP)。
方案3.合成5’-三磷酸-3’-AOM-C(DB)核苷酸
合成中间体C1
将5-碘-5'-O-(叔丁基二苯基甲硅烷基)-2'-脱氧胞苷(3g,5.07mmol)溶于30mL无水吡啶中,然后滴加三甲基氯硅烷(1.29mL,10.1mmol)。在RT下将反应物搅拌1小时,然后置于冰浴中,缓慢滴加苯甲酰氯(648μL,5.6mmol)。将反应物从冰浴中取出,然后在RT下搅拌1小时。完成后,将溶液置于冰浴中并用50mL冷水淬灭,然后添加50mL甲醇和20mL吡啶,在RT下将悬浮液搅拌过夜。减压蒸发溶剂,将残余物溶于200mL EtOAc中,用2×200mL饱和NaHCO3和100mL盐水萃取。有机相用MgSO4干燥,过滤后蒸发至干。取粗产物通过硅胶快速色谱法纯化,得到C1。收率:2.535g(3.64mmol,73%)。LC-MS(ESI):(正离子)m/z 696(M+H+),797(M+Et3NH+)。
合成中间体C2
将N-苯甲酰基-5-碘-5'-O-(叔丁基二苯基甲硅烷基)-2'-脱氧胞苷(C1)(695mg,1mmol)和乙酸钯(II)(190mg,0.85mmol)溶于干燥脱气DMF(10mL)中,然后添加N-烯丙基三氟乙酰胺(7.65mL,5mmol)。将溶液置于真空下并用氮气吹扫3次,然后添加脱气三乙胺(278μL,2mmol)。将溶液加热至约80℃,避光1小时。将所得黑色混合物冷却至室温,然后用50mLEtOAc稀释,再用100mL水萃取。然后用EtOAc萃取水相。合并有机相,用MgSO4干燥,过滤后蒸发至干。取粗产物通过硅胶快速色谱法纯化,得到C2。收率:305mg(0.42mmol,42%)。LC-MS(ES和CI):(正离子)m/z 721(M+H+),797(M+Et3NH+)。
合成中间体C3
将N-苯甲酰基-5-[3-(2,2,2-三氟乙酰氨基)-烯丙基]-5'-O-(叔丁基二苯基甲硅烷基)2'-脱氧胞苷(C2)(350mg,0.486mmol)溶于1.1mL无水DMSO(14.5mmol)中,然后添加冰醋酸(1.7mL,29.1mmol)和乙酸酐(1.7mL,17mmol)。将反应物加热至60℃保持6小时,然后用50mL饱和NaHCO3水溶液淬灭。溶液停止冒泡后,用EtOAc萃取。合并有机相,用饱和NaHCO3水溶液、水和盐水洗涤。有机相用MgSO4干燥,过滤后蒸发至干。取粗产物通过硅胶快速色谱法纯化,得到C3。收率:226mg(0.289mmol,60%)。LC-MS(ESI):(正离子)m/z 781(M+H+),882(M+Et3NH+)。
合成中间体C4
在N2气氛下将N-苯甲酰基-5-[3-(2,2,2-三氟乙酰氨基)-烯丙基]-5'-O-(叔丁基二苯基甲硅烷基)-3'-O-甲硫基甲基-2'-脱氧胞苷(C3)(210mg,0.27mmol)溶于5mL无水DCM中,添加环己烯(136μL,1.35mmol),然后将溶液冷却至约-10℃。滴加新蒸馏的1M硫酰氯的无水DCM溶液(320μL,0.32mmol),将反应物搅拌20分钟。在所有起始材料已消耗掉之后,添加额外部分的环己烯(136μL,1.35mmol),减压蒸发反应物至干。用氮气快速吹扫残余物,然后将残余物溶于2.5mL冰冷的无水DCM中,在0℃下一边搅拌一边添加冰冷的烯丙醇(2.5mL)。在0℃下将反应物搅拌3小时,然后用饱和NaHCO3水溶液淬灭,接下来进一步用饱和NaHCO3水溶液稀释。用EtOAc萃取混合物。合并的有机相用MgSO4干燥,过滤后蒸发至干。取残余物通过硅胶快速色谱法纯化,得到C4。收率:58%(124mg,0.157mmol)。LC-MS(ESI):(正离子)m/z 791(M+H+)。
合成中间体C5
在N2气氛下将N-苯甲酰基-5-[3-(2,2,2-三氟乙酰氨基)-烯丙基]-5'-O-(叔丁基二苯基甲硅烷基)-3'-O-烯丙氧基甲基-2'-脱氧胞苷(C4)(120mg,0.162mmol)溶于无水THF(5mL)中,然后置于0℃下。添加冰醋酸(29μL,0.486mmol),之后立即添加1.0M TBAF的THF溶液(486μL,0.486mmol)。在0℃下将溶液搅拌3小时。用EtOAc将溶液稀释,然后用0.025N HCl和盐水萃取。有机相用MgSO4干燥,过滤后蒸发至干。取残余物通过硅胶快速色谱法纯化,得到C5。收率:50mg(0.090mmol,55%)。LC-MS(ESI):(正离子)m/z 553(M+H+)。(负离子)m/z551(M-H+),587(M+Cl-)。
合成中间体C6
减压下将N-苯甲酰基-3'-O-烯丙氧基甲基-5-[3-(2,2,2-三氟乙酰氨基)-烯丙基]-2'-脱氧胞苷(C5)(50mg,0.0.09mmol)用P2O5干燥18小时。在氮气下向其中添加无水磷酸三乙酯(1mL)和一些新活化的分子筛,然后在冰浴中将反应烧瓶冷却至0℃。滴加新蒸馏的POCl3(10μL,0.108mmol),之后滴加Proton(29mg,0.135mmol)。添加后,在0℃下将反应物进一步搅拌15分钟。然后,快速添加0.5M焦磷酸二-三正丁基铵盐(1mL,0.45mmol)的无水DMF溶液,之后立即添加三正丁基胺(100μL,0.4mmol)。将反应物在冰水浴中再保持10分钟,然后将其倒入1M三乙基碳酸氢铵水溶液(TEAB,5mL)中淬灭,在RT下搅拌4小时。减压蒸发所有溶剂。向上述残余物中添加35%氨水溶液(5mL),在RT下将混合物搅拌18小时。减压蒸发溶剂,将残余物再悬浮于10mL 0.1M TEAB中,然后过滤。首先在DEAE-Sephadex A25(50g)上通过离子交换色谱法纯化滤液。用三乙基碳酸氢铵水溶液洗脱色谱柱。合并含有三磷酸的级分,减压蒸发溶剂至干。取粗料通过制备型HPLC进一步纯化。获得化合物C6,为三乙基铵盐。收率:40.6μmol(45%),基于ε290=5041M-1cm-11H NMR(400MHz,D2O):δ(ppm)8.23(s,1H,H-6),6.53(dd,J=15.5,0.9Hz,1H,Ar-CH=),6.42–6.24(m,2H,Ar-CH=CH-,1’-CH),5.98(ddt,J=17.3,10.4,5.9Hz,1H,O-CH2-CH=),5.37(dq,J=17.3,1.6Hz,1H,CHH=),5.29(ddt,J=10.4,1.6,1.1Hz,1H,CHH=),4.89(s,2H,O-CH2-O),4.60(dt,J=6.2,3.1Hz,1H,3’-CH),4.39(t,J=2.7Hz,1H,4’-CH),4.35(dq,J=12.0,3.8Hz,1H,5’-CHH),4.28–4.21(m,1H,5’-CHH),4.20(ddt,J=6.0,2.7,1.4Hz,1H,=CH-CH2-O),3.73(dt,J=7.2,1.4Hz,2H,CH2-NH2),3.18(q,J=7.3Hz,20H,Et3N),2.59(ddd,J=14.1,6.1,3.3Hz,1H,2’-CHH),2.37(ddd,J=14.2,7.2,6.1Hz,1H,2’-CHH),1.27(t,J=7.3Hz,31H,Et3N).31P NMR(162MHz,D2O):δ(ppm)-6.06(d,J=20.7Hz,γP),-11.24(d,J=19.1Hz,αP),-21.95(t,J=19.7Hz,βP)。LC-MS(ESI):(负离子)m/z 591(M-H+)。
此外,还制备了具有以下结构的5’-三磷酸-3’-AOM-C核苷酸、5’-三磷酸-3’-AOM-T(DB)核苷酸:
以及对应的ffC和ffT(DB)。最后,还制备了5’-三磷酸-3’-AOM-G(也称为ffG-(3′-AOM))详细的合成步骤描述于美国专利公布号2020/0216891中。
具有AOL接头部分的完全官能化核苷酸的一般合成过程
将染料-COOH(0.02mmol)或染料-AOL(0.02mmol)与2×2mL的无水N,N’-二甲基甲酰胺(DMF)共蒸发,然后溶于2mL无水N,N’-二甲基乙酰胺(DMA)中。添加N,N-二异丙基乙胺(17μL,0.1mmol),之后添加N,N,N',N'-四甲基-O-(N-琥珀酰亚胺)脲四氟硼酸盐(TSTU,6mg,0.02mmol)。在RT下,将反应物在氮气下搅拌1小时。与此同时,减压蒸发核苷酸三磷酸(0.01mmol)的水溶液至干,然后再悬浮于200μL的0.1M三乙基碳酸氢铵(TEAB)水溶液中。将活化的染料溶液添加到核苷酸三磷酸中,在RT下将反应物搅拌18小时,然后通过RP-HPLC监测。首先在DEAE-Sephadex A25(25g)上通过离子交换色谱法纯化粗产物,用三乙基碳酸氢铵(TEAB,0.1M至1M)水溶液进行线性梯度洗脱。合并含有三磷酸的级分,减压蒸发溶剂至干。取粗料通过制备型HPLC进一步纯化。
ffA-(3’AOM)-AOL-BL-NR650C5的表征:收率66%(6.6μmol)。LC-MS(ES):(负离子)m/z 1931(M-H+),965(M-2H+)。
ffA-(3’AOM)-AOL-BL-NR550s0的表征:收率65%(6.5μmol)。LC-MS(ES):(负离子)m/z 1784(M-H+),891(M-2H+)。
ffA(DB)-(3’AOM)-AOL-BL-NR650C5的表征:收率31%(3.1μmol)。LC-MS(ES):(负离子)m/z 1933(M-H+),965(M-2H+),644(M-3H+)。
ffA(DB)-(3’AOM)-AOL-NR7181A的表征:收率21%(2.12μmol)。LC-MS(ES):(负离子)m/z=1475(M-H+)。
ffA-(3'-AOM)-AOL-NR7180A的表征:收率41%(4.1μmol)。LC-MS(ES):(负离子)m/z 1472(M-H+),736(M-2H+)。
ffA(DB)-(3'-AOM)-AOL-BL-NR550S0的表征:收率21%(2.1μmol)。LC-MS(ES):(负离子)m/z 1786(M-H+),892(M-2H+),594(M-3H+)。
ffC(DB)-(3’AOM)-AOL-SO7181的表征:收率48%(4.87μmol)。LC-MS(ES):(负离子)m/z 1577(M-H+),788(M-2H+),525(M-3H+)。
ffC-(3'-AOM)-AOL-SO7181的表征:收率56%(5.6μmol)。LC-MS(ES):(负离子)m/z1575(M-H+),787(M-2H+)。
ffT(DB)-3’AOM-AOL-AF550POPOS0的表征:收率46%(4.6μmol)。LC-MS(ES):(负离子)m/z 1609(M-H+),804(M-2H+),536(M-3H+)。
ffT(DB)-(3’AOM)-AOL-NR550s0的表征:收率38%(3.8μmol)。LC-MS(ES):(负离子)m/z=1535(M-H+)。
实施例2.不同钯试剂配方的溶液裂解效率
图1展示了对以下三种不同钯试剂配方的溶液裂解效率的比较:1)10mM[(烯丙基)PdCl]2、100mM THP、100mM乙醇胺缓冲液、10mM抗坏血酸钠;2)20mM Na2PdCl4、60mM THP、100mM N,N’-二乙基乙醇胺、10mM抗坏血酸钠、1M NaCl、0.1%吐温20;3)20mM Na2PdCl4、70mM THP、100mM N,N’-二乙基乙醇胺、10mM抗坏血酸钠、1M NaCl、0.1%吐温20。裂解效率通过测量3’-AOM-核苷酸底物的相对裂解速率来确定。简言之,向0.1mM 3’-AOM-核苷酸底物的100mM缓冲液溶液中添加钯试剂的储备溶液,以使Pd物质的最终浓度为1mM。将溶液在RT下孵育,然后监测反应动力学,方式为:在设定时间点从反应物中取出等分试样,用1:1的EDTA/H2O2(0.1:0.1M)溶液将其淬灭,然后通过HPLC分析这些等分试样中3’-OH核苷酸的形成情况和3’-AOM核苷酸底物的消失情况。如图1所示,Na2PdCl4在仅使用3或3.5当量的THP时的裂解效率与[(烯丙基)PdCl]2的裂解效率相当,与之相比,[(烯丙基)PdCl]2使用了10当量的THP。
实施例3:AOM-AOL ffN在溶液中的稳定性研究以及在测序中的性能
图2展示了具有3'-AOM封端基团和AOL接头部分(包括标记的ffT-DB、标记的ffA和标记的ffC,以及未标记的ffG)的完全官能化核苷酸(ffN)与已受到胁迫的标准ffN相比的预定相性能。将两组ffN在45℃下在仅排除DNA聚合酶的标准掺入混合物配方中孵育几天。对于每个时间点,添加新鲜的聚合酶以获得完整的掺入混合物,然后直接上样于使用先前描述的测序条件。预定相%是该混合物中存在的3’OH-ffN的百分比的直接指示,因此与3’封端基团的稳定性直接相关。记录两组ffN的预定相值并作图(图2)。与标准物相比,AOM-AOL-ffN没有表现出预定相的任何增加,而且似乎比具有3’-O-叠氮甲基封端基团和LN3接头部分的标准ffN稳定得多。
实施例4.在测序反应中使用钯清除剂
图3展示了在使用具有3′-AOM封端基团和标准LN3接头部分(包括标记的ffT-DB、标记的ffA和标记的ffC,以及未标记的ffG)的完全官能化核苷酸(ffN)时,在裂解后的洗涤步骤中使用异氰基乙酸钾和不使用异氰基乙酸钾的情况下,Illumina的仪器上的定相值的比较。测序实验在Illumina的上使用卡盒进行,其中将标准掺入混合物试剂替换为新鲜制备的包含具有3'-AOM封端基团和标准LN3接头部分的ffN的掺入混合物,并且其中将新鲜制备的钯裂解试剂溶液(10mM[(烯丙基)PdCl]2、100mM THP、100mM乙醇胺缓冲液、10mM抗坏血酸钠、1M NaCl、0.1%吐温20)添加到空的孔中。将异氰基乙酸钾添加到标准的裂解后洗涤溶液中,达到10mM的最终浓度。测序实验使用2×151个循环的流程进行,该流程除包括标准的边合成边测序(SBS)方案外,还包括与钯裂解试剂溶液一起孵育5秒。如图3所示,观察到当在裂解后洗涤溶液中使用10mM异氰基乙酸钾时,%定相从0.183降低至0.075。
图4展示了在使用具有3'-AOM封端基团和AOL接头部分(包括标记的ffT-DB、标记的ffA和标记的ffC,以及未标记的ffG)的完全官能化核苷酸(ffN)时,在使用了钯清除剂的情况下,Illumina的仪器上的主要测序指标(包括定相、预定相和错误率),以及与之比较的在使用具有3'-O-叠氮甲基封端基团和LN3接头部分的标准ffN时的相同测序指标。测序实验在Illumina的上通过使用标准卡盒运行2×151个循环的流程进行,其中将掺入混合物试剂和标准裂解试剂分别替换为新鲜制备的包含具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)的掺入混合物,以及新鲜制备的钯裂解试剂溶液(10mM[(烯丙基)PdCl]2、100mM THP、100mM N,N’-二乙基乙醇胺缓冲液、10mM抗坏血酸钠、1M NaCl、0.1%吐温20)。将异氰基乙酸钾(ICNA)添加到标准的裂解后洗涤溶液中,达到10mM的最终浓度。使用标准的试剂盒与流程,用具有3’-O-叠氮甲基封端基团的标准ffN进行了对照测序实验。结果显示出在预定相和更重要的错误率方面的改进,从而证明该AOM-AOL SBS化学反应与单个裂解步骤结合具有完全效率。
实施例5.在测序反应中使用甘氨酸
图5展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在掺入混合物中分别使用甘氨酸或乙醇胺的情况下,Illumina的仪器上的主要测序指标(包括定相和预定相)的比较。在该实施例中,整组ffN包括3'-AOM-ffA-AOL(标记的)、3'-AOM-ffG-AOL(未标记的)、3'-AOM-ffT(DB)-AOL(标记的)和3'-AOM-ffC(DB)-AOL(标记的)。如图5所示,观察到在掺入缓冲液中使用甘氨酸时,与含有乙醇胺的标准掺入缓冲液相比,定相值显著降低。尽管在使用甘氨酸时预定相值略有增加,但不认为这是有意义的增加。测序实验在标准仪器上使用卡盒进行,其中将标准掺入混合物试剂和标准裂解试剂分别替换为新鲜制备的包含具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)的掺入混合物在50mM乙醇胺或50mM甘氨酸缓冲液中的溶液,以及新鲜制备的钯裂解试剂溶液(10mM[(烯丙基)PdCl]2、100mM THP、100mM N,N’-二乙基乙醇胺缓冲液、10mM抗坏血酸钠、1M NaCl、0.1%吐温20)。将异氰基乙酸钾(ICNA)添加到标准的MiniSeq裂解后洗涤溶液中,达到10mM的最终浓度。采用具有2×151个循环的标准MiniSeq流程。
图6展示了在使用具有3'-AOM和AOL接头部分的完全官能化核苷酸(ffN)时,Illumina的仪器上的主要测序指标(包括定相、预定相和错误率),以及与之比较的在使用具有3'-O-叠氮甲基封端基团和LN3接头部分的标准ffN时的相同测序指标。在该实施例中,整组ffN包括3'-AOM-ffA-AOL(标记的)、3'-AOM-ffG-AOL(未标记的)、3'-AOM-ffT(DB)-AOL(标记的)和3'-AOM-ffC(DB)-AOL(标记的)。测序实验在装载卡盒的标准仪器上使用2×151个循环的流程进行,其中将标准掺入混合物试剂和标准裂解试剂分别替换为新鲜制备的包含具有3'-AOM封端基团的完全官能化核苷酸(ffN)的掺入混合物在50mM甘氨酸缓冲液中的溶液,以及新鲜制备的钯裂解试剂溶液(10mM[(烯丙基)PdCl]2、100mM THP、100mM N,N’-二乙基乙醇胺缓冲液、10mM抗坏血酸钠、1M NaCl、0.1%吐温20)。将异氰基乙酸钾添加到标准的裂解后洗涤溶液中,达到10mM的最终浓度。结果表明,与使用标准ffN产生的错误率相比,错误率进一步改善。据信,AOM-AOL系列的定相与图5的指标相比改善是由于使用了甘氨酸缓冲液和3'-AOM-ffC(DB)-AOL。
实施例6.在iSeqTM上边合成边测序
图7A和图7B展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在Illumina的iSeqTM仪器上执行的边合成边测序2×300次循环的主要测序指标(包括错误率和Q30评分)的比较。在该实施例中,整组AOM ffN包括3'-AOM-ffA(DB)-AO-染料1、3'-AOM-ffG(未标记的)、3'-AOM-ffT(DB)-AOL-NR550S0和3'-AOM-ffC(DB)-AOL-染料2。整组叠氮甲基(AZM)ffN包括具有3’-叠氮甲基封端基团、炔丙基酰氨基和LN3接头的相同ffN。染料1是美国序列号63/127061中所公开的色烯喹啉染料,当与ffA缀合时具有结构部分染料2是美国专利公布号2018/0094140中公开的香豆素染料,当与ffC缀合时具有结构部分NR550S0是已知的绿色染料。
测序实验在标准iSeqTM仪器上使用卡盒进行,其中将标准掺入混合物试剂和标准裂解试剂分别替换为新鲜制备的包含具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)的掺入混合物在使用300%浓度的聚合酶1901(Pol 1901)(360μg/mL)的50mM乙醇胺或50mM甘氨酸缓冲液中的溶液,以及新鲜制备的钯裂解试剂溶液(10mM[(烯丙基)PdCl]2、100mM THP、100mM N,N’-二乙基乙醇胺缓冲液、10mM抗坏血酸钠、1M NaCl、0.1%吐温20)。将L-半胱氨酸添加到标准iSeqTM裂解后洗涤溶液中,达到10mM的最终浓度。在2次激发/1次发射方案中采用具有2×301个循环的iSeqTM流程。特别地,将iSeqTM仪器设置为用绿色激发光(约520nm)拍摄第一图像,并且用蓝色激发光(约450nm)拍摄第二图像。使用标准测序流程进行2×301个SBS循环(掺入,之后成像,再裂解)。测序指标汇总于下表中。
观察到AOM ffN组提供了良好的性能,从而为读取1和读取2提供优越的错误率和Q30。使用AOM ffN组时的定相值与由AZM ffN组产生的定相值相当。然而,AOM ffN组产生显著较低的预定相值。
图8A和图8B展示了在使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)时,在Illumina的iSeqTM仪器上执行的边合成边测序2×150次循环的主要测序指标(包括错误率和Q30评分)的比较。在该实施例中,整组AOM ffN包括3'-AOM-ffA(DB)-AO-染料1、3'-AOM-ffG(未标记的)、3'-AOM-ffT(DB)-AOL-NR550S0和3'-AOM-ffC(DB)-AOL-染料2。整组AZM ffN包括具有3’-叠氮甲基封端基团、炔丙基酰氨基和LN3接头的相同ffN。测序实验在标准iSeqTM仪器上使用卡盒进行,其中将标准掺入混合物试剂和标准裂解试剂分别替换为新鲜制备的包含具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)的掺入混合物在使用300%浓度的Pol 1901(360μg/mL)的50mM乙醇胺或50mM甘氨酸缓冲液中的溶液,以及新鲜制备的钯裂解试剂溶液(10mM[(烯丙基)PdCl]2、100mM THP、100mM N,N’-二乙基乙醇胺缓冲液、10mM抗坏血酸钠、1M NaCl、0.1%吐温20)。将L-半胱氨酸添加到标准iSeqTM裂解后洗涤溶液中,达到10mM的最终浓度。在2次激发/1次发射方案中采用具有2×301个循环的iSeqTM流程。特别地,将iSeqTM仪器设置为用绿色激发光(约520nm)拍摄第一图像,并且用蓝色激发光(约450nm)拍摄第二图像。使用标准测序流程进行2×301个SBS循环(掺入,之后成像,再裂解)。
AZM ffN的掺入混合物接触时间为约24.1秒,而AOM ffN的掺入混合物接触时间为约29.1秒。然而,AOM ffN的掺入时间较长由较短的解封时间来抵消。裂解混合物接触时间为约5.8秒,相比之下,AZM ffN组的裂解混合物接触时间为约10.2秒。因此,AZM ffN组和AOM ffN组的总孵育时间分别为约34.4秒和34.9秒。测序指标汇总于下表中。
同样,观察到AOM ffN组提供了良好的性能,从而为读取1和读取2提供优越的错误率和Q30。此外,AOM ffN组产生较低的预定相值。
实施例7.在带蓝色激光功率滴定的NovaSeqTM上进行边合成边测序
已经观察到,在SBS测序中长时间暴露于蓝光,由于光剂量和功率密度增加,导致高水平的信号延迟和定相。该实施例在蓝色激光滴定测序实验中将AOM ffN和AZM ffN的性能进行比较。
在该实验中,将使用AOM ffN组在改进的蓝/绿激发NovaSeqTM上运行的1×151次SBS与使用具有3’-叠氮甲基封端基团和LN3接头的标准ffN组时的情况进行比较。使用的流通池为490nm间距BEER2流通池。蓝色激光功率的功率配置为:600mW、800mW、1000mW、1400mW、1800mW和2400mW。绿色激光功率恒定在1000mM。使用以下标准AZM ffN:绿色ffT(LN3-AF550POPOS0)、暗色G、红色ffC(LN3-SO7181)、蓝色ffC(sPA-蓝色染料A)、蓝色ffA(LN3-BL-蓝色染料A)、绿色ffA(LN3-BL-NR550S0)。对于AOM ffN组,使用以下ffN:绿色ffT(ffT(DB)-AOL-AF550POPOS0)、暗色G、红色ffC(ffC(DB)-AOL-SO7181)、蓝色ffC(ffC(DB)-AOL-蓝色染料A)、蓝色ffA(ffA(DB)-AOL-BL-蓝色染料A)、绿色ffA(ffA(DB)-AOL-BL-NR550S0)。被标记为AOM ffC和ffA的蓝色染料的结构如下所示:
对于用AOM ffN组运行SBS,进行了以下修改。首先,将10mM L-半胱氨酸添加到裂解后洗涤溶液中。裂解混合物包括以下组分:DEEA缓冲液及其中的Na2PdCl4。将两个10秒等待步骤添加到裂解后洗涤步骤中。此外,使用了60秒静态掺入等待时间(与AZM ffN的38秒形成对照)。图9A示出这两个ffN组在较低的蓝色激光功率下具有相似的定相值,但AOM ffN组对蓝色激光功率滴定增加较不敏感(由与AZM定相斜率相比较为平缓的定相斜率表示)。此外,还观察到AOM ffN的预定相值低得多。如图9B所示,AOM ffN组在较高的蓝色激光功率下具有显著较小的信号衰减。图9C和图9D展示平均错误率随循环次数的变化。图9D是图9C的放大视图。结果表明,虽然AZM ffN在较低的蓝色激光功率下在前期循环中具有较低的错误率,但AOM ffN组在较高的蓝色激光功率下在后期循环中却表现得好得多。图9E汇总了151个循环的平均错误率。同样,AOM ffN组在高激光功率下(例如,在1400mW、1800mW和2400mW下)的表现优于AZM ffN组。
实施例8.使用Pd裂解混合物的第一化学线性化
在该实施例中,在成簇步骤之后的第一化学线性化步骤中测试了SBS中所使用的Pd裂解混合物。该实验将化学线性化与标准酶促线性化进行了比较,在标准酶促线性化中,USER促使双链多核苷酸之一在P5引物上的U位裂解。使用具有3'-AOM封端基团和AOL接头部分的完全官能化核苷酸(ffN)在Illumina的iSeqTM仪器上进行了1×150个SBS循环。在该实施例中,整组AOM ffN包括3'-AOM-ffA(DB)-AO-染料1、3'-AOM-ffG(未标记的)、3'-AOM-ffT(DB)-AOL-NR550S0和3'-AOM-ffC(DB)-AOL-染料2,如实施例6中所述。将iSeqTM仪器设置为用绿色激发光(约520nm)拍摄第一图像,并且用蓝色激发光(约450nm)拍摄第二图像(采用2次激发/1次发射方案)。将经修饰的P5/P7引物接枝在iSeqTM仪器上所使用的流通池上,以允许P5引物进行第一化学线性化。该化学线性化步骤在Pd裂解混合物(10mM[Pd(烯丙基)Cl]2和100mM THP在含有DEEA的缓冲液中的溶液)中进行,该Pd裂解混合物在63℃下孵育30s。图10展示了使用两种不同线性化方法的SBS测序指标。观察到当在第一化学线性化步骤中使用Pd裂解混合物时,所有主要测序指标均落入标准观察范围内。该实验证实,单种试剂混合物可以用于两个分开的测序步骤—线性化步骤和SBS裂解步骤,这使得能够进一步简化仪器(流道和卡盒)。

Claims (28)

1.一种核苷或核苷酸,其包含经由可裂解接头附接到可检测标记的核碱基,其中所述核苷或核苷酸具有式(I)结构:
其中B为嘌呤、脱氮嘌呤或嘧啶;
R4为H或OH;
R5并且其中Ra、Rb、Rc、Rd和Re各自独立地为H、或未取代的C1-C6烷基;
-OR6为单磷酸根、二磷酸根、或三磷酸根;
L为
X和Y各自独立地为O或S;
R1a、R1b、R2、R3a和R3b各自独立地为H、或未取代的C1-C6烷基;以及
其中L1
其中L2存在,并且L2
其中m和n各自独立地为整数1、2、3、4、5、6、7、8、9或10;
其中所述标记为荧光染料。
2.根据权利要求1所述的核苷或核苷酸,其中X和Y各自为O。
3.根据权利要求1所述的核苷或核苷酸,其中R1a、R1b、R2、R3a和R3b各自为H。
4.根据权利要求1所述的核苷或核苷酸,其中R1a、R1b、R2、R3a和R3b中的至少一者为未取代的C1-C6烷基。
5.根据权利要求1所述的核苷或核苷酸,其中R5
6.根据权利要求1所述的核苷或核苷酸,其包含式(Ia)、(Ia′)、(Ib)、(Ic)、(Ic′)或(Id)的结构:
其中R4、R6、L2和标记如权利要求1所定义。
7.根据权利要求1所述的核苷或核苷酸,其中n为5。
8.根据权利要求1所述的核苷或核苷酸,其中m为4。
9.根据权利要求1所述的核苷或核苷酸,其中R4为H并且-OR6为三磷酸根。
10.根据权利要求7所述的核苷或核苷酸,其中R4为H并且-OR6为三磷酸根。
11.一种寡核苷酸或多核苷酸,其包含权利要求9所述的核苷酸。
12.根据权利要求11所述的寡核苷酸或多核苷酸,其中所述寡核苷酸或多核苷酸与模板多核苷酸杂交。
13.根据权利要求12所述的寡核苷酸或多核苷酸,其中所述模板多核苷酸固定在固体载体上。
14.根据权利要求13所述的寡核苷酸或多核苷酸,其中所述固体载体包括多个固定化模板多核苷酸的阵列。
15.一种寡核苷酸或多核苷酸,其包含权利要求10所述的核苷酸。
16.一种在测序反应中制备与目标单链多核苷酸互补的生长中的多核苷酸的方法,包括将权利要求9所述的核苷酸掺入生长中的互补多核苷酸中,其中掺入所述核苷酸防止任何后续核苷酸引入所述生长中的互补多核苷酸中。
17.一种确定目标单链多核苷酸的序列的方法,包括:
(a)将权利要求9所述的核苷酸掺入与所述目标多核苷酸链的至少一部分互补的拷贝多核苷酸链中;
(b)检测掺入所述拷贝多核苷酸链中的所述核苷酸的身份;以及
(c)以化学方式从掺入所述拷贝多核苷酸链中的所述核苷酸除去可检测标记和3′-OH封端基团。
18.一种试剂盒,其包括权利要求9所述的一种或多种核苷酸。
19.根据权利要求18所述的试剂盒,其还包括酶、至少一种Pd(0)清除剂,以及一种或多种缓冲剂。
20.根据权利要求19所述的试剂盒,其中所述酶是DNA聚合酶、末端脱氧核苷酸转移酶或逆转录酶。
21.根据权利要求19所述的试剂盒,其中所述至少一种Pd(0)清除剂是:
22.根据权利要求18所述的试剂盒,其还包括钯催化剂。
23.根据权利要求22所述的试剂盒,其中所述钯催化剂是由Pd(II)络合物和一种或多种水溶性膦原位生成的Pd(0)催化剂。
24.根据权利要求23所述的试剂盒,其中所述Pd(II)络合物是[Pd(烯丙基)Cl]2或Na2PdCl4
25.根据权利要求23所述的试剂盒,其还包括一种或多种Pd(II)清除剂。
26.根据权利要求25所述的试剂盒,其中所述一种或多种Pd(II)清除剂选自由以下组成的组:异氰基乙酸酯(ICNA)盐、异氰基乙酸乙酯、异氰基乙酸甲酯、半胱氨酸或其盐、L-半胱氨酸或其盐、N-乙酰基-L-半胱氨酸、乙基黄原酸钾、异丙基黄原酸钾、谷胱甘肽、硫辛酸、乙二胺四乙酸(EDTA)、亚氨基二乙酸、次氮基二乙酸、三巯基-S-三嗪、二甲基二硫代氨基甲酸酯、二硫苏糖醇、巯基乙醇、烯丙醇、炔丙醇、硫醇、叔胺、叔膦,或者它们的组合。
27.一种试剂盒,其包括权利要求10所述的一种或多种核苷酸。
28.根据权利要求27所述的试剂盒,其还包括DNA聚合酶、至少一种Pd(0)清除剂,以及一种或多种缓冲剂。
CN202180044416.1A 2020-06-22 2021-06-21 具有3’缩醛封端基团的核苷与核苷酸 Active CN115867560B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202510319781.9A CN120174072A (zh) 2020-06-22 2021-06-21 具有3’缩醛封端基团的核苷与核苷酸

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063042240P 2020-06-22 2020-06-22
US63/042,240 2020-06-22
PCT/EP2021/066886 WO2021259881A1 (en) 2020-06-22 2021-06-21 Nucleosides and nucleotides with 3' acetal blocking group

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202510319781.9A Division CN120174072A (zh) 2020-06-22 2021-06-21 具有3’缩醛封端基团的核苷与核苷酸

Publications (2)

Publication Number Publication Date
CN115867560A CN115867560A (zh) 2023-03-28
CN115867560B true CN115867560B (zh) 2025-03-28

Family

ID=76765108

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202510319781.9A Pending CN120174072A (zh) 2020-06-22 2021-06-21 具有3’缩醛封端基团的核苷与核苷酸
CN202180044416.1A Active CN115867560B (zh) 2020-06-22 2021-06-21 具有3’缩醛封端基团的核苷与核苷酸

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202510319781.9A Pending CN120174072A (zh) 2020-06-22 2021-06-21 具有3’缩醛封端基团的核苷与核苷酸

Country Status (16)

Country Link
US (3) US11787831B2 (zh)
EP (1) EP4168421A1 (zh)
JP (1) JP2023531009A (zh)
KR (1) KR20230031837A (zh)
CN (2) CN120174072A (zh)
AU (1) AU2021295081A1 (zh)
BR (1) BR112022026056A2 (zh)
CA (1) CA3177293A1 (zh)
CL (1) CL2022003661A1 (zh)
CO (1) CO2022018487A2 (zh)
IL (2) IL297992B2 (zh)
MA (1) MA58991B1 (zh)
MX (1) MX2022016492A (zh)
PE (1) PE20230492A1 (zh)
WO (1) WO2021259881A1 (zh)
ZA (1) ZA202211847B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11293061B2 (en) 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group
AU2021295081A1 (en) * 2020-06-22 2022-12-08 Illumina Cambridge Limited Nucleosides and nucleotides with 3' acetal blocking group
JP2024519372A (ja) * 2021-05-20 2024-05-10 イルミナ インコーポレイテッド 合成によって配列決定するための組成物及び方法
CA3222937A1 (en) 2021-12-29 2023-07-06 Jonathan Mark Boutell Methods of nucleic acid sequencing using surface-bound primers
EP4511512A2 (en) 2022-05-27 2025-02-26 Illumina, Inc. 3'-blocked nucleotides and nanopore-based method of synthesizing polynucleotides using the same
US20240141427A1 (en) * 2022-09-30 2024-05-02 Illumina, Inc. Polymerases, compositions, and methods of use
CN119013285A (zh) * 2022-10-09 2024-11-22 深圳市真迈生物科技有限公司 还原叠氮甲氧基类基团的方法、测序方法及试剂盒
CN119095982A (zh) 2022-12-22 2024-12-06 伊路米纳有限公司 用于边合成边测序的钯催化剂组合物和方法
CN119095983A (zh) 2022-12-22 2024-12-06 伊路米纳有限公司 用于边合成边测序的过渡金属催化剂组合物和方法
US20240271206A1 (en) 2022-12-27 2024-08-15 Illumina, Inc. Methods of sequencing using 3' allyl blocked nucleotides
AU2024247902A1 (en) 2023-03-30 2024-12-12 Illumina, Inc. Compositions and methods for nucleic acid sequencing
WO2024249591A1 (en) 2023-05-31 2024-12-05 Illumina, Inc. Methods for double-stranded sequencing by synthesis
US20250002974A1 (en) 2023-06-30 2025-01-02 Illumina, Inc. Protecting fully functional nucleotides from degradation
WO2025062002A1 (en) 2023-09-20 2025-03-27 Illumina, Inc. Concurrent sequencing using nick translation
WO2025184226A1 (en) 2024-02-28 2025-09-04 Illumina, Inc. Nucleotides with terminal phosphate capping

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105377869A (zh) * 2013-03-15 2016-03-02 伊鲁米纳剑桥有限公司 修饰的核苷或核苷酸

Family Cites Families (131)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5936696A (ja) 1982-08-20 1984-02-28 Taiho Yakuhin Kogyo Kk 2′―デオキシ―5―置換ウリジン誘導体及びそれを含有する抗腫瘍剤
EP0104857A1 (en) * 1982-09-28 1984-04-04 Beecham Group Plc Deoxyuridine compounds, methods for preparing them and their use in medicine
US4772691A (en) 1985-06-05 1988-09-20 The Medical College Of Wisconsin, Inc. Chemically cleavable nucleotides
DE3529478A1 (de) 1985-08-16 1987-02-19 Boehringer Mannheim Gmbh 7-desaza-2'desoxyguanosin-nukleotide, verfahren zu deren herstellung und deren verwendung zur nukleinsaeure-sequenzierung
US5242796A (en) 1986-07-02 1993-09-07 E. I. Du Pont De Nemours And Company Method, system and reagents for DNA sequencing
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US6346413B1 (en) 1989-06-07 2002-02-12 Affymetrix, Inc. Polymer arrays
US5547839A (en) 1989-06-07 1996-08-20 Affymax Technologies N.V. Sequencing of surface immobilized polymers utilizing microflourescence detection
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
DE3924454A1 (de) 1989-07-24 1991-02-07 Cornelis P Prof Dr Hollenberg Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips)
US5302509A (en) 1989-08-14 1994-04-12 Beckman Instruments, Inc. Method for sequencing polynucleotides
CA2044616A1 (en) 1989-10-26 1991-04-27 Roger Y. Tsien Dna sequencing
ES2097925T3 (es) 1991-09-18 1997-04-16 Affymax Tech Nv Metodo para sintetizar diversas colecciones de oligomeros.
DE69233087T2 (de) 1991-11-22 2003-12-24 Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) Verfahren zur Herstellung von Polymerarrays
CA2130562A1 (en) 1992-02-19 1993-09-02 Alexander B. Chetverin Novel oligonucleotide arrays and their use for sorting, isolating, sequencing, and manipulating nucleic acids
US5583211A (en) 1992-10-29 1996-12-10 Beckman Instruments, Inc. Surface activated organic polymers useful for location - specific attachment of nucleic acids, peptides, proteins and oligosaccharides
US5472672A (en) 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US6156501A (en) 1993-10-26 2000-12-05 Affymetrix, Inc. Arrays of modified nucleic acid probes and methods of use
JPH09507121A (ja) 1993-10-26 1997-07-22 アフィマックス テクノロジーズ ナームロゼ ベノートスハップ 生物学的チップ上の核酸プローブアレー
US5429807A (en) 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US6232465B1 (en) 1994-09-02 2001-05-15 Andrew C. Hiatt Compositions for enzyme catalyzed template-independent creation of phosphodiester bonds using protected nucleotides
WO1998053300A2 (en) 1997-05-23 1998-11-26 Lynx Therapeutics, Inc. System and apparaus for sequential processing of analytes
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
AU5171696A (en) 1995-02-27 1996-09-18 Ely Michael Rabani Device, compounds, algorithms, and methods of molecular characterization and manipulation with molecular parallelism
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
DE69638321D1 (de) 1995-10-11 2011-03-03 Luminex Corp Gleichzeitige mehrfachanalyse klinischer proben
US5658734A (en) 1995-10-17 1997-08-19 International Business Machines Corporation Process for synthesizing chemical compounds
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6297006B1 (en) 1997-01-16 2001-10-02 Hyseq, Inc. Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
WO1998033939A1 (fr) 1997-01-31 1998-08-06 Hitachi, Ltd. Procede pour determiner une sequence de base d'acide nucleique et appareil correspondant
DE69824716D1 (de) 1997-04-01 2004-07-29 Manteia S A Methode zur sequenzierung von nukleinsäuren
EP2327797B1 (en) 1997-04-01 2015-11-25 Illumina Cambridge Limited Method of nucleic acid sequencing
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
AU737174B2 (en) 1997-10-10 2001-08-09 President & Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6087102A (en) 1998-01-07 2000-07-11 Clontech Laboratories, Inc. Polymeric arrays and methods for their use in binding assays
US6287776B1 (en) 1998-02-02 2001-09-11 Signature Bioscience, Inc. Method for detecting and classifying nucleic acid hybridization
JP3944996B2 (ja) 1998-03-05 2007-07-18 株式会社日立製作所 Dnaプローブアレー
US6031078A (en) 1998-06-16 2000-02-29 Millennium Pharmaceuticals, Inc. MTbx protein and nucleic acid molecules and uses therefor
US6335155B1 (en) 1998-06-26 2002-01-01 Sunesis Pharmaceuticals, Inc. Methods for rapidly identifying small organic molecule ligands for binding to biological target molecules
DE69928265T3 (de) 1998-07-30 2013-11-28 Illumina Cambridge Ltd. Matrizen von biomolekülen und ihre verwendung in sequenzierung
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6391937B1 (en) 1998-11-25 2002-05-21 Motorola, Inc. Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers
US6255476B1 (en) * 1999-02-22 2001-07-03 Pe Corporation (Ny) Methods and compositions for synthesis of labelled oligonucleotides and analogs on solid-supports
DE60039037D1 (de) 1999-03-10 2008-07-10 Asm Scient Inc Methode zur direkten sequenzierung von nukleinsäuren
ATE413467T1 (de) 1999-04-20 2008-11-15 Illumina Inc Detektion von nukleinsäurereaktionen auf kügelchen-arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6372813B1 (en) 1999-06-25 2002-04-16 Motorola Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays
US6664061B2 (en) 1999-06-25 2003-12-16 Amersham Biosciences Ab Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
GB0013276D0 (en) 2000-06-01 2000-07-26 Amersham Pharm Biotech Uk Ltd Nucleotide analogues
EP2100971A3 (en) 2000-07-07 2009-11-25 Visigen Biotechnologies, Inc. Real-time sequence determination
EP1307414A2 (en) 2000-08-09 2003-05-07 Amersham Biosciences AB The use and evaluation of a 2+2] photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
AU2001296645A1 (en) 2000-10-06 2002-04-15 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding dna and rna
WO2002044425A2 (en) 2000-12-01 2002-06-06 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
EP1560838B1 (en) * 2002-08-23 2009-05-13 Illumina Cambridge Limited Labelled nucleotides
EP3363809B1 (en) 2002-08-23 2020-04-08 Illumina Cambridge Limited Modified nucleotides for polynucleotide sequencing
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
EP2789383B1 (en) 2004-01-07 2023-05-03 Illumina Cambridge Limited Molecular arrays
EP1790202A4 (en) 2004-09-17 2013-02-20 Pacific Biosciences California APPARATUS AND METHOD FOR ANALYZING MOLECULES
EP1888743B1 (en) 2005-05-10 2011-08-03 Illumina Cambridge Limited Improved polymerases
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
GB0517097D0 (en) 2005-08-19 2005-09-28 Solexa Ltd Modified nucleosides and nucleotides and uses thereof
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
EP2018622B1 (en) 2006-03-31 2018-04-25 Illumina, Inc. Systems for sequence by synthesis analysis
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
DE112007002932B4 (de) 2006-12-01 2015-08-06 The Trustees Of Columbia University In The City Of New York Vierfarben DNA-Sequenzierung mittels Synthese unter Verwendung von abspaltbaren, reversiblen, fluoreszierenden Nucleotidterminatoren
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8349167B2 (en) 2006-12-14 2013-01-08 Life Technologies Corporation Methods and apparatus for detecting molecular interactions using FET arrays
US7948015B2 (en) 2006-12-14 2011-05-24 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
GB0700562D0 (en) 2007-01-11 2007-02-21 Novartis Vaccines & Diagnostic Modified Saccharides
EP2209911B1 (en) 2007-10-19 2013-10-16 The Trustees of Columbia University in the City of New York Dna sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators and a deoxyinosine analogue with a reversible terminator group
WO2009097368A2 (en) 2008-01-28 2009-08-06 Complete Genomics, Inc. Methods and compositions for efficient base calling in sequencing reactions
US20100137143A1 (en) 2008-10-22 2010-06-03 Ion Torrent Systems Incorporated Methods and apparatus for measuring analytes
US8951781B2 (en) 2011-01-10 2015-02-10 Illumina, Inc. Systems, methods, and apparatuses to image a sample for biological or chemical analysis
US9624539B2 (en) 2011-05-23 2017-04-18 The Trustees Of Columbia University In The City Of New York DNA sequencing by synthesis using Raman and infrared spectroscopy detection
PL3290528T3 (pl) 2011-09-23 2020-03-31 Illumina, Inc. Sposoby i kompozycje do sekwencjonowania kwasów nukleinowych
US9085698B2 (en) 2011-09-23 2015-07-21 Illumina Cambridge Limited Dyes for labelling molecular ligands
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
US9150896B2 (en) 2012-09-06 2015-10-06 Illumina, Inc. Nucleotides and primers with removable blocking groups
US8754244B1 (en) 2013-03-08 2014-06-17 Illumina Cambridge Limited Rhodamine compounds and their use as fluorescent labels
CN105164106B (zh) 2013-03-08 2018-04-03 伊鲁米纳剑桥有限公司 多次甲基化合物和其作为荧光标记物的用途
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
GB201508858D0 (en) 2015-05-22 2015-07-01 Illumina Cambridge Ltd Polymethine compounds with long stokes shifts and their use as fluorescent labels
GB201516987D0 (en) 2015-09-25 2015-11-11 Illumina Cambridge Ltd Polymethine compounds and their use as fluorescent labels
US10273539B2 (en) * 2015-11-06 2019-04-30 Qiagen Sciences, Llc Methods of using nucleotide analogues
CN105315318B (zh) 2015-11-06 2019-04-19 山东大学 一种α‐L‐鼠李糖苷酶在制备5-氟-2’-脱氧脲苷衍生物中的应用
WO2017221929A1 (ja) * 2016-06-21 2017-12-28 株式会社ジーンデザイン リボ核酸h-ホスホネートモノマーの合成方法および本モノマーを用いたオリゴヌクレオチド合成
JP2018008186A (ja) 2016-07-11 2018-01-18 三菱ケミカル株式会社 水不溶性金属捕集剤、貴金属の回収方法および貴金属回収設備
US11390641B2 (en) * 2016-07-27 2022-07-19 Hoffmann-La Roche Inc. 5′S-LNA nucleotides and oligonucleotides
US10385214B2 (en) 2016-09-30 2019-08-20 Illumina Cambridge Limited Fluorescent dyes and their uses as biomarkers
EP4257596A3 (en) 2016-12-22 2023-12-06 Illumina Cambridge Limited Coumarin compounds and their uses as fluorescent labels
CA3048486A1 (en) 2017-01-04 2018-07-12 Complete Genomics, Inc. Stepwise sequencing by non-labeled reversible terminators or natural nucleotides
WO2018138685A2 (en) 2017-01-27 2018-08-02 Janssen Biotech, Inc. Cyclic dinucleotides as sting agonists
GB201716931D0 (en) 2017-10-16 2017-11-29 Illumina Cambridge Ltd New fluorescent compounds and their use as biomarkers
CN112204176A (zh) 2018-03-21 2021-01-08 生捷科技控股公司 用于制造dna测序阵列的方法和系统
SG11201912274UA (en) 2018-05-15 2020-01-30 Illumina Inc Compositions and methods for chemical cleavage and deprotection of surface-bound oligonucleotides
SG11202012493WA (en) 2018-10-31 2021-01-28 Illumina Inc Polymerases, compositions, and methods of use
CN120082639A (zh) 2018-11-09 2025-06-03 深圳华大智造科技股份有限公司 使用未标记的核苷酸进行大规模平行测序
SG11202012559SA (en) 2018-12-05 2021-01-28 Illumina Inc Polymerases, compositions, and methods of use
JP7296409B2 (ja) 2018-12-17 2023-06-22 イルミナ ケンブリッジ リミテッド ポリヌクレオチドシーケンシングに使用するための組成物
US11293061B2 (en) * 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group
US20240182963A1 (en) 2018-12-26 2024-06-06 Illumina, Inc. Methods of sequencing using 3' blocked nucleotides
MX2020013416A (es) 2019-03-01 2021-04-28 Illumina Cambridge Ltd Compuestos de coumarina sustituidos con amina terciaria y sus usos como etiquetas fluorescentes.
KR102829192B1 (ko) 2019-03-01 2025-07-04 일루미나 케임브리지 리미티드 엑소사이클릭 아민 치환된 쿠마린 화합물 및 형광 표지로서의 이의 용도
EP4081657A1 (en) 2019-12-23 2022-11-02 Illumina Inc Nanoparticle with single site for template polynucleotide attachment
US20240209015A1 (en) 2020-06-22 2024-06-27 Illumina, Inc. Methods of sequencing using 3' blocked nucleotides
AU2021295081A1 (en) * 2020-06-22 2022-12-08 Illumina Cambridge Limited Nucleosides and nucleotides with 3' acetal blocking group
US11981964B2 (en) 2020-07-28 2024-05-14 Illumina Cambridge Limited Substituted coumarin dyes and uses as fluorescent labels
US20220195517A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Long stokes shift chromenoquinoline dyes and uses in sequencing applications
EP4334327A1 (en) 2021-05-05 2024-03-13 Illumina Cambridge Limited Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
US20240218443A1 (en) 2021-05-20 2024-07-04 Illumina, Inc. Methods of sequencing using 3' blocked nucleotides
JP2024519372A (ja) 2021-05-20 2024-05-10 イルミナ インコーポレイテッド 合成によって配列決定するための組成物及び方法
EP4499872A1 (en) 2022-03-29 2025-02-05 Illumina, Inc. Systems and methods of sequencing polynucleotides
CN119301275A (zh) 2022-05-31 2025-01-10 伊路米纳有限公司 用于核酸测序的组合物和方法
AU2023296605A1 (en) 2022-06-28 2025-01-09 Illumina, Inc. Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing
US20240271206A1 (en) 2022-12-27 2024-08-15 Illumina, Inc. Methods of sequencing using 3' allyl blocked nucleotides

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105377869A (zh) * 2013-03-15 2016-03-02 伊鲁米纳剑桥有限公司 修饰的核苷或核苷酸
CN108864232A (zh) * 2013-03-15 2018-11-23 伊鲁米纳剑桥有限公司 修饰的核苷或核苷酸

Also Published As

Publication number Publication date
US12286453B2 (en) 2025-04-29
MA58991A1 (fr) 2023-03-31
US20210403500A1 (en) 2021-12-30
MA58991B1 (fr) 2024-09-30
IL316161A (en) 2024-12-01
BR112022026056A2 (pt) 2023-03-07
IL297992B2 (en) 2025-03-01
US20250236635A1 (en) 2025-07-24
CN120174072A (zh) 2025-06-20
EP4168421A1 (en) 2023-04-26
WO2021259881A1 (en) 2021-12-30
CN115867560A (zh) 2023-03-28
JP2023531009A (ja) 2023-07-20
CA3177293A1 (en) 2021-12-30
PE20230492A1 (es) 2023-03-23
IL297992A (en) 2023-01-01
AU2021295081A1 (en) 2022-12-08
KR20230031837A (ko) 2023-03-07
MX2022016492A (es) 2023-03-06
ZA202211847B (en) 2024-02-28
CL2022003661A1 (es) 2023-06-09
US11787831B2 (en) 2023-10-17
CO2022018487A2 (es) 2023-03-07
US20240132532A1 (en) 2024-04-25
IL297992B1 (en) 2024-11-01

Similar Documents

Publication Publication Date Title
CN115867560B (zh) 具有3’缩醛封端基团的核苷与核苷酸
US12227802B2 (en) Nucleotides with a 3′ AOM blocking group
CN117916390A (zh) 用于边合成边测序的组合物和方法
CN115996937B (zh) 烷基吡啶正离子香豆素染料和在测序应用中的用途
US20240271206A1 (en) Methods of sequencing using 3' allyl blocked nucleotides
US20240209015A1 (en) Methods of sequencing using 3' blocked nucleotides
US20240182963A1 (en) Methods of sequencing using 3' blocked nucleotides
US20240218443A1 (en) Methods of sequencing using 3' blocked nucleotides
RU2818762C2 (ru) Нуклеозиды и нуклеотиды с 3’-гидрокси блокирующими группами и их применение в способах секвенирования полинуклеотидов
CN119095982A (zh) 用于边合成边测序的钯催化剂组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant