CN119213143A

CN119213143A - 用于原位测序的组合物和方法

Info

Publication number: CN119213143A
Application number: CN202380039444.3A
Authority: CN
Inventors: P·J·马克思; M·施那尔-拉文
Original assignee: 10X Genomics Ltd
Current assignee: 10X Genomics Ltd
Priority date: 2022-05-11
Filing date: 2023-05-11
Publication date: 2024-12-27
Also published as: US20250051842A1; US20250257398A1; WO2023220300A1; EP4522769A1; US12325877B2; US20240084378A1; JP2025516589A; US12270074B1; US12365944B1

Abstract

描述了用于在细胞或组织样品中进行原位逐碱基测序的方法和组合物，其最小化光学拥挤。在一些实施方案中，测序引物与样品中标识符序列(例如，条形码序列)的3’处的引发位点杂交，使得测序引物可以使用标识符序列作为模板由聚合酶以逐碱基方式延伸。可以使样品与核苷酸在循环系列的核苷酸掺入或结合步骤中接触，并且可以检测指示掺入或结合事件的信号以生成信号代码序列，该信号代码序列包含在连续循环中检测到的一系列信号代码(对应于信号(ON信号)、信号缺失(OFF信号)或其组合)。可以使用至少部分地基于信号代码序列对标识符序列的解码来检测和定位相应的分析物。

Description

用于原位测序的组合物和方法

相关申请的交叉引用

本申请要求2022年5月11日提交的美国临时专利申请序列号63/340,730的优先权权益，该临时专利申请的内容全文以引用方式并入本文。

技术领域

本公开总体上涉及用于原位检测样品中的分析物的方法和组合物。

背景技术

使用显微成像对细胞和组织样品进行基因组学、转录组学和蛋白质组学分析可以同时解析多种感兴趣的分析物，从而原位提供关于分析物丰度和定位的有价值信息。因此，原位测定例如对于了解细胞身份的分子基础和开发疾病治疗方法是重要的工具。需要新的和改进的原位测定方法。本文提供了解决这些和其他需求的方法和组合物。

发明内容

原位检测方法的多重可扩展性可能受到光学拥挤的限制。例如，与大尺寸特征(例如，滚环扩增(RCA)产物、核酸探针或核酸复合物)和/或高强度相关联的信号可能与其他信号重叠和/或掩盖其他信号，尤其是当信号来自紧挨着的特征时，而与小尺寸特征和/或弱强度相关联的信号可能无法达到检测阈值。在任一情况下，多重测定中例如与靶分析物相关联的标识符序列的信号检测和解码的质量可能受到损害。另外，某些现有方法需要复杂的寡核苷酸探针池，这增加了检测和解码的成本和时间。

本公开在一些方面涉及用于在细胞或组织样品中进行原位逐碱基测序的方法和组合物。在一些实施方案中，测序引物与样品中标识符序列(例如，条形码序列)的3’处的引发位点杂交，使得测序引物可以使用标识符序列的序列作为模板由聚合酶以逐碱基方式延伸。可以使细胞或组织样品与核苷酸在循环系列的核苷酸掺入或核苷酸结合步骤中接触，并且可以在每个循环中检测指示掺入或结合事件的信号以生成信号代码序列，该信号代码序列包含对应于在连续循环中检测到的信号(ON信号)、信号缺失(OFF信号)或ON和OFF信号的组合的一系列信号代码。可以在样品中的多个位置处生成多种不同标识符序列的信号代码序列并用于解码相应的分析物。

在一些实施方案中，本文提供了一种分析生物样品的方法，所述方法包括：a)使生物样品与第一探针和第二探针接触，其中：生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，第一探针和第二探针分别直接或间接地与第一分析物和第二分析物结合，第一探针或其产物包含i)第一测序引物的第一引发位点和ii)与第一分析物相关联的第一标识符序列，并且第二探针或其产物包含i)第二测序引物的第二引发位点和ii)与第二分析物相关联的第二标识符序列；b)使用第一测序引物和第二测序引物进行第一标识符序列和第二标识符序列的逐碱基测序，例如边合成边测序(SBS)或边结合边测序(SBB)，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含各自对应于在连续循环中分别在第一位置和第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的信号代码，其中在连续循环中的一个或多个中，在第一位置处检测到ON信号并且在第二位置处检测到OFF信号；和c)至少部分地基于第一信号代码序列和第二信号代码序列检测生物样品中的第一标识符序列和第二标识符序列。

在一些实施方案中，第一分析物和第二分析物是相同的。在一些实施方案中，第一分析物和第二分析物是不同的。在本文的任何实施方案中，第一标识符序列和第二标识符序列可以不同。在本文的任何实施方案中，第一标识符序列和第二标识符序列可以包含分析物序列或其互补序列。

在本文的任何实施方案中，第一标识符序列和第二标识符序列可以包含条形码序列或其互补序列。在本文的任何实施方案中，条形码序列可以分别分配给第一分析物和第二分析物。在一些实施方案中，分配条形码序列基于设计成最小化在一个或多个连续循环中的每一个中检测到的ON信号的最大预测密度的决策规则。在一些实施方案中，将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物的决策规则包括基于第一分析物和第二分析物的表达数据的分配。在一些实施方案中，将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物包括基于聚类细胞类型中第一分析物和第二分析物的表达数据的分配。在一些实施方案中，聚类细胞类型代表存在于生物样品中的细胞类型的分布。在一些实施方案中，第一分析物和第二分析物的表达数据至少部分地重叠。在一些实施方案中，第一分析物和第二分析物的表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

在本文的任何实施方案中，方法可以包括将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物。在一些实施方案中，在特定循环中检测到的第一条形码序列中的核苷酸对应于包含ON信号的信号代码，并且在特定循环中检测到的第二条形码序列中的相应核苷酸对应于包含OFF信号的信号代码。在一些实施方案中，在特定循环中检测到的第一条形码序列中的核苷酸仅对应于ON信号，并且在特定循环中检测到的第二条形码序列中的相应核苷酸仅对应于OFF信号。在本文的任何实施方案中，可以选择待在同一循环中检测的第一条形码序列和第二条形码序列中的一对或多对相应的核苷酸以减少在该循环中检测到的信号的光学拥挤。

在本文的任何实施方案中，可以通过使生物样品与核苷酸在连续循环中接触来进行逐碱基测序，其中在每个循环中形成复合物，所述复合物包含i)分别与第一引发位点或第二引发位点杂交的第一测序引物或第二测序引物或其延伸产物，ii)聚合酶，和iii)与第一标识符序列或第二标识符序列中的核苷酸碱基配对的同源核苷酸，并且在生物样品中的特定位置处检测到与复合物中的同源核苷酸和/或聚合酶相关联的信号(ON信号)和/或信号缺失(OFF信号)，其中ON信号、OFF信号或其组合对应于同源核苷酸和第一标识符序列或第二标识符序列中的相应核苷酸中的碱基。

在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中25％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列可以被设计为使得其中多于25％的核苷酸对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中30％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列可以被设计为使得其中多于30％的核苷酸对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列可以被设计为使得其中多于35％的核苷酸对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中40％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列可以被设计为使得其中多于45％的核苷酸对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中50％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列可以被设计为使得其中多于55％的核苷酸对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中60％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列可以被设计为使得其中多于65％的核苷酸对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中70％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中75％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中80％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中85％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中90％或更多的核苷酸可以被分配为对应于OFF信号。在本文的任何实施方案中，第一标识符序列和/或第二标识符序列中95％或更多的核苷酸可以被分配为对应于OFF信号。

在本文的任何实施方案中，可以在生物样品中检测多种不同的标识符序列，并且可以在生物样品中的一个或多个位置处检测每种不同的标识符序列。在一些实施方案中，所述多种不同标识符序列是多种唯一的标识符序列，例如，各自唯一地对应于分析物。在本文的任何实施方案中，50％或更多的不同标识符序列可以各自在标识符序列中包含50％或更多的对应于OFF信号的核苷酸。在本文的任何实施方案中，80％或更多的不同标识符序列可以各自在标识符序列中包含80％或更多的对应于OFF信号的核苷酸。

在本文的任何实施方案中，信号代码可以各自对应于第一颜色的信号、第二颜色的信号、第三颜色的信号、或信号缺失，并且其中第一、第二和第三颜色是不同的。在本文的任何实施方案中，信号代码可以各自对应于第一颜色的信号、第二颜色的信号、第一颜色和第二颜色的信号的组合或信号缺失，其中第一颜色和第二颜色是不同的。在本文的任何实施方案中，信号代码可以各自对应于信号(ON信号)和/或信号缺失(OFF信号)的组合，其中在两个或更多个成像步骤中检测到ON和/或OFF信号的组合。

在本文的任何实施方案中，方法还可以包括基于检测第一标识符序列和第二标识符序列来检测生物样品中的第一分析物和第二分析物。在本文的任何实施方案中，第一标识符序列可以是第一分析物的序列或其互补序列。在本文的任何实施方案中，第二标识符序列可以是第二分析物的序列或其互补序列。在本文的任何实施方案中，第一标识符序列可以是对应于第一分析物、与第一分析物相关联和/或鉴定第一分析物的第一条形码序列或其互补序列。在本文的任何实施方案中，第二标识符序列可以是对应于第二分析物、与第二分析物相关联和/或鉴定第二分析物的第二条形码序列或其互补序列。

在本文的任何实施方案中，第一条形码序列可以用于鉴定第一分析物。在本文的任何实施方案中，第二条形码序列可以用于鉴定第二分析物。

在本文的任何实施方案中，第一探针可以以直接或间接地与第一分析物结合的第一多种探针提供。在一些实施方案中，第一多种探针共同包含条形码序列的第一组合，并且条形码序列的第一组合鉴定第一分析物。在本文的任何实施方案中，第二探针可以以直接或间接地与第二分析物结合的第二多种探针提供。在一些实施方案中，第二多种探针共同包含条形码序列的第二组合，并且条形码序列的第二组合鉴定第二分析物。

在本文的任何实施方案中，第一分析物和第二分析物可以包含核酸序列。在本文的任何实施方案中，第一标识符序列可以包含第一分析物的序列或其互补序列，并且第二标识符序列可以包含第二分析物的序列或其互补序列。

在本文的任何实施方案中，逐碱基测序可以包括使用荧光标记的聚合酶和一种或多种未荧光标记的核苷酸。在本文的任何实施方案中，逐碱基测序可以包括使用聚合酶-核苷酸缀合物，所述缀合物包含与未荧光标记的核苷酸部分连接的荧光标记的聚合酶。在本文的任何实施方案中，逐碱基测序可以包括使用多价聚合物-核苷酸缀合物，所述缀合物包含聚合物核心、多个核苷酸部分和一种或多种荧光标记。

在一些实施方案中，在逐碱基测序期间，聚合酶不将同源核苷酸掺入到第一测序引物或第二测序引物或其延伸产物中。在一些实施方案中，聚合酶将同源核苷酸掺入到第一测序引物或第二测序引物或其延伸产物中的掺入被减弱或抑制。

在本文的任何实施方案中，逐碱基测序可以包括使生物样品与核苷酸混合物接触，该核苷酸混合物包含荧光标记的核苷酸和未荧光标记的核苷酸。在一些实施方案中，在逐碱基测序期间，聚合酶将同源核苷酸掺入到第一测序引物或第二测序引物或其延伸产物中，并且同源核苷酸是荧光标记的或是未荧光标记的。

在本文的任何实施方案中，逐碱基测序可以包括：使生物样品与第一核苷酸混合物接触，其中包含第一碱基的核苷酸未被可检测地标记，而包含除第一碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，以及使生物样品与后续核苷酸混合物接触，其中包含后续碱基的核苷酸未被可检测地标记，而包含除后续碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，其中所述后续碱基与所述第一碱基相同，任选地其中所述第一碱基和所述后续碱基为A、T、C或G。

在本文的任何实施方案中，逐碱基测序可以包括：使生物样品与第一核苷酸混合物接触，其中包含第一碱基的核苷酸未被可检测地标记，而包含除第一碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，以及使生物样品与后续核苷酸混合物接触，其中包含后续碱基的核苷酸未被可检测地标记，而包含除后续碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，其中所述后续碱基不同于所述第一碱基。

在本文的任何实施方案中，可以使生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：核苷酸混合物1，其中包含G的核苷酸未被可检测地标记，而包含A、C或T的核苷酸被可检测地标记；核苷酸混合物2，其中包含T的核苷酸未被可检测地标记，而包含A、C或G的核苷酸被可检测地标记；核苷酸混合物3，其中包含C的核苷酸未被可检测地标记，而包含A、G或T的核苷酸被可检测地标记；和核苷酸混合物4，其中包含A的核苷酸未被可检测地标记，而包含G、C或T的核苷酸被可检测地标记。

在本文的任何实施方案中，每种核苷酸混合物可以彼此独立地在一个或多个循环中与生物样品接触，其中所述循环是连续的或非连续的。在本文的任何实施方案中，独立于彼此地，每种核苷酸混合物可以包含：具有三个不同颜色的荧光标记的可检测地标记的核苷酸，三种碱基中的每一种一个颜色，例如，A为红色，G为蓝色，T为绿色，C无可检测标记；具有两个不同颜色的荧光标记的可检测地标记的核苷酸，三种碱基中的两种每种一个颜色，其中包含剩余一种碱基的核苷酸用两种颜色标记，例如，A为红色和绿色，G为红色，T为绿色，C无可检测标记；或具有相同颜色的荧光标记的可检测地标记的核苷酸，其中包含三种碱基中的一种的核苷酸上的荧光标记被配置成待切割，并且包含三种碱基中的另一种的核苷酸被配置成用荧光标记标记。

在本文的任何实施方案中，可使生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：核苷酸混合物1，其中包含G或A的核苷酸未被可检测地标记，而包含C或T的核苷酸被可检测地标记；核苷酸混合物2，其中包含G或T的核苷酸未被可检测地标记，而包含C或A的核苷酸被可检测地标记；核苷酸混合物3，其中包含G或C的核苷酸未被可检测地标记，而包含A或T的核苷酸被可检测地标记；和核苷酸混合物4，其中包含C或A的核苷酸未被可检测地标记，而包含G或T的核苷酸被可检测地标记；核苷酸混合物5，其中包含C或T的核苷酸未被可检测地标记，而包含G或A的核苷酸被可检测地标记；和核苷酸混合物6，其中包含A或T的核苷酸未被可检测地标记，而包含G或C的核苷酸被可检测地标记。

在本文的任何实施方案中，第一引发位点和第二引发位点可以不同。在本文的任何实施方案中，方法可以包括：b1)使第一测序引物与第一引发位点杂交并且进行逐碱基测序以生成第一测序引物的延伸产物和第一信号代码序列；b2)去除、切割或阻断b1)中第一测序引物的延伸产物；以及b3)使第二测序引物与第二引发位点杂交并且进行逐碱基测序(例如，SBS或sBB)以生成第二测序引物的延伸产物和第二信号代码序列。

在本文的任何实施方案中，针对第一多种分析物的探针或其产物可以共享共同的第一引发位点，并且针对第二多种分析物的探针或其产物可以共享共同的第二引发位点。在本文的任何实施方案中，第二多种分析物可以包含两种或更多种不同的分析物，这些分析物与第一多种分析物中的两种或更多种不同的分析物不同。

在本文的任何实施方案中，可以使生物样品与各自被配置成直接或间接地与不同的分析物结合的多种探针接触，并且每种探针或其产物可以包含不同引发位点的组合。在本文的任何实施方案中，第一探针或其产物可以包括包含第一引发位点的不同引发位点的第一组合。在本文的任何实施方案中，第二探针或其产物可以包括包含第二引发位点的不同引发位点的第二组合。

在本文的任何实施方案中，可以使生物样品与直接或间接地与第三分析物结合的第三探针接触。在本文的任何实施方案中，第三探针或其产物可以包括包含第一引发位点、第二引发位点和/或第三引发位点的不同引发位点的第三组合。

在本文的任何实施方案中，所述第一组合、第二组合和第三组合中的任何两个或更多个可以共享一个或多个共同的引发位点。

在本文的任何实施方案中，方法可以包括：b’)使生物样品与第一测序引物接触以进行逐碱基测序，从而使第一测序引物与第一探针或其产物中以及一种或多种其他探针或其产物中的第一引发位点杂交，并且生成第一测序引物的延伸产物；b”)去除、切割或阻断b’)中所述第一测序引物的所述延伸产物；以及b”’)使生物样品与第二测序引物接触以进行逐碱基测序，从而使第二测序引物与第二探针或其产物中以及一种或多种其他探针或其产物中的第二引发位点杂交，并且生成第二测序引物的延伸产物。

在本文的任何实施方案中，b’)中的逐碱基测序可以通过如下进行：使生物样品与核苷酸在连续循环中接触，检测与每个连续循环的核苷酸掺入或结合相关联的信号，以及生成第一多种分析物的信号代码序列。

在本文的任何实施方案中，b”’)中的逐碱基测序可以通过如下进行：使生物样品与核苷酸在连续循环中接触，检测与每个连续循环的核苷酸掺入或结合相关联的信号，以及生成第二多种分析物的信号代码序列。在一些实施方案中，第一多种分析物和第二多种分析物包含一种或多种共同的分析物。在一些实施方案中，第一多种分析物和第二多种分析物不包含共同的分析物。

在本文的任何实施方案中，每种分析物可以独立地是核酸分析物或非核酸分析物。在本文的任何实施方案中，每种探针可以独立地是i)直接地与其相应的分析物结合的初级探针，或ii)直接或间接地与初级探针结合的探针。在一些实施方案中，初级探针和直接或间接地与初级探针结合的探针独立地选自：包含3’或5’突出部的探针，任选地其中所述3’或5’突出部包含一种或多种条形码序列；包含3’突出部和5’突出部的探针，任选地其中所述3’突出部和所述5’突出部各自独立地包含一种或多种条形码序列；环状探针；可环化探针或探针组；包含被配置成与夹板杂交的分割杂交区(split hybridization region)的探针或探针组，任选地其中所述分割杂交区包含一种或多种条形码序列；及其组合。

在本文的任何实施方案中，每种探针的产物可以包括在生物样品中原位生成的滚环扩增(RCA)产物。在本文的任何实施方案中，逐碱基测序可以在生物样品中原位进行。

在一些方面，本文公开了分析生物样品的方法，所述方法包括：a)使生物样品与第一测序引物和第二测序引物接触，其中：生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一核酸和第二核酸，第一核酸包含i)与第一测序引物互补的第一引发位点和ii)第一标识符序列，而第二核酸包含i)与第二测序引物互补的第二引发位点和ii)第二标识符序列；b)使用与第一引发位点杂交的第一测序引物进行第一标识符序列的逐碱基测序以生成第一信号代码序列，所述第一信号代码序列包含在连续循环中在第一位置处检测到的信号代码，其中信号代码对应于信号(ON信号)、信号缺失(OFF信号)或其组合；c)随后使用与第二引发位点杂交的第二测序引物进行第二标识符序列的逐碱基测序以生成第二信号代码序列，所述第二信号代码序列包含在另外的连续循环中在第二位置处检测到的信号代码；其中在b)中的连续循环和c)中的另外的连续循环中的至少一个或多个中，在第一位置和第二位置中的一个或两个处检测到OFF信号；以及d)至少部分地基于第一信号代码序列和第二信号代码序列分别检测生物样品中第一位置和第二位置处的第一标识符序列和第二标识符序列。

在一些方面，本文公开了分析生物样品的方法，所述方法包括：a)使生物样品与第一探针和第二探针接触，其中：生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，第一探针和第二探针分别直接或间接地与第一分析物和第二分析物结合，第一探针或其产物包含i)第一测序引物的第一引发位点和ii)与第一分析物相关联的第一标识符序列，并且第二探针或其产物包含i)第二测序引物的第二引发位点和ii)与第二分析物相关联的第二标识符序列；b)使用第一测序引物进行第一标识符序列的逐碱基测序(例如，使用至少一个暗碱基(dark base))以生成第一信号代码序列，所述第一信号代码序列包含在连续循环中在第一位置处检测到的信号代码，其中信号代码对应于信号(ON信号)、信号缺失(OFF信号)或其组合；c)随后使用第二测序引物进行第二标识符序列的逐碱基测序(例如，使用至少一个暗碱基)以生成第二信号代码序列，所述第二信号代码序列包含在另外的连续循环中在第二位置处检测到的信号代码；其中在b)中的所述连续循环和c)中的所述另外的连续循环中的至少一个或多个中，检测到OFF信号；以及d)至少部分地基于第一信号代码序列和第二信号代码序列分别检测生物样品中第一位置和第二位置处的第一标识符序列和第二标识符序列。在一些实施方案中，在b)中的连续循环和c)中的另外的连续循环中的至少一个或多个中，在第一位置和第二位置中的一个或两个处检测到OFF信号。

在一些实施方案中，在使用第一测序引物的连续循环和使用第二测序引物的另外的连续循环中的至少一个或多个中，在同一逐碱基测序循环中在第一位置和第二位置处都未检测到ON信号。在一些实施方案中，在使用第一测序引物的连续循环中的至少一个或多个和在使用第二测序引物的另外的连续循环中的至少一个或多个中，在同一逐碱基测序循环中在第一位置和第二位置处都未检测到ON信号。在一些实施方案中，在使用第一测序引物的连续循环中的两个或更多个和在使用第二测序引物的另外的连续循环中的两个或更多个中，在同一逐碱基测序循环中在第一位置和第二位置处都未检测到ON信号。在一些实施方案中，在使用第一测序引物的连续循环中的三个或更多个和在使用第二测序引物的另外的连续循环中的三个或更多个中，在同一逐碱基测序循环中在第一位置和第二位置处都未检测到ON信号。在第一位置和第二位置彼此邻近的情况下，本文公开的方法减少生物样品中原位逐碱基测序期间的光学拥挤。

在本文的任何实施方案中，可以通过使用未被可检测地标记的一种、两种或三种核苷酸(例如，A、T/U、C和G中的任何一种、两种或三种)进行逐碱基测序来生成OFF信号，而其他的一种或多种核苷酸被可检测地标记。与一个或多个其他循环相比，可以在特定的循环中使用不同的核苷酸或核苷酸的不同组合。在一些实施方案中，未被可检测地标记的核苷酸可以是天然核苷酸或其衍生物，例如天然存在的核苷酸，其不包括外源标记(例如，荧光染料或任何其他标记)或化学修饰。可检测地标记的一种或多种核苷酸可以与可检测标记(例如，荧光染料或任何其他标记)共价(例如，经由键或接头)或非共价(例如，经由结合对诸如生物素或其衍生物或类似物和链霉亲和素或其衍生物或类似物)结合。在其他实例中，可检测地标记的一种或多种核苷酸可以与部分(例如，抗原或抗原结合分子诸如抗体)缀合，该部分允许用与该部分特异性结合并能够产生可检测信号的试剂来检测核苷酸，并且由该试剂产生的可检测信号可以用于检测核苷酸的掺入。所述部分可以经由可切割接头与核苷酸缀合。

在本文的任何实施方案中，可以通过在特定的测序循环中从与样品接触的核苷酸混合物中省略一种、两种或三种核苷酸(例如，A、T/U、C和G中的任何一种、两种或三种)地进行逐碱基测序来生成OFF信号，而核苷酸混合物仅含有可检测地标记的其他一种或多种核苷酸。与一个或多个其他循环相比，可以在特定的循环中使用(或从核苷酸混合物中省略)不同的核苷酸或核苷酸的不同组合。

在本文的任何实施方案中，可以通过在特定的测序循环中不检测与样品接触的一种、两种或三种核苷酸(例如，A、T/U、C和G中的任何一种、两种或三种)地进行逐碱基测序来生成OFF信号，而仅检测其他一种或多种核苷酸。与一个或多个其他循环相比，可以在特定的循环中检测(或不检测)不同的核苷酸或核苷酸的不同组合。例如，在某测序循环中使用抗原或抗体标记的核苷酸的情况下，不检测与该核苷酸相关联的信号可以通过从该测序循环中的信号检测中省略用可检测标记标记的相应抗体或抗原来实现。

在本文的任何实施方案中，可以选择每个代码字(例如，对应于信号代码序列)必须具有的“ON”循环/位的数量，并且可以相应地设计代码字。在本文的任何实施方案中，代码字中“ON”循环/位的数量可以在约3至约8之间。在本文的任何实施方案中，代码字中“ON”循环/位的数量可以为4、5、6或7。在本文的任何实施方案中，可以采用对代码字的约束来方便鉴定正确的标识符序列(例如，条形码序列，诸如对应于RCP的条形码序列)。在本文的任何实施方案中，每个代码字可以具有至少X种颜色的“ON”位，其中X为3或4，以区别于往往保持单一颜色的背景荧光源。

在本文的任何实施方案中，第一测序引物和第二测序引物可以同时或以任一顺序依次与样品接触。在本文的任何实施方案中，第一测序引物和第二测序引物可以同时或以任一顺序依次与样品接触。在本文的任何实施方案中，第一标识符序列和第二标识符序列可以在DNA(例如，基因组DNA)、RNA(例如，mRNA)、直接或间接地与DNA(例如，基因组DNA)或RNA(例如，mRNA)结合的探针或产物诸如DNA(例如，基因组DNA)、RNA(例如，mRNA)或探针的滚环扩增产物中。

在本文的任何实施方案中，第一标识符序列和第二标识符序列可相同。在本文的任何实施方案中，第一标识符序列和第二标识符序列可不同。

在本文的任何实施方案中，第一标识符序列和第二标识符序列可包含分别分配给第一分析物和第二分析物的条形码序列或其互补序列。在一些实施方案中，基于设计成最小化在一个或多个连续循环中的每一个中检测到的ON信号的最大预测密度的决策规则，第一引发位点和/或第一条形码序列可被分配给第一分析物，并且第二引发位点和/或第二条形码序列被分配给第二分析物。在一些实施方案中，分配可包括基于第一分析物和第二分析物的表达数据的分配。在一些实施方案中，分配可包括基于聚类细胞类型中第一分析物和第二分析物的表达数据的分配。在一些实施方案中，聚类细胞类型可代表存在于生物样品中的细胞类型的分布。在一些实施方案中，第一分析物和第二分析物的表达数据可至少部分地重叠。在一些实施方案中，第一分析物和第二分析物的表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

在本文的任何实施方案中，在特定的循环中检测到的第一条形码序列或第二条形码序列中的核苷酸可对应于包含ON信号的信号代码。在本文的任何实施方案中，在特定的循环中检测到的第一条形码序列或第二条形码序列中的核苷酸可对应于包含OFF信号的信号代码。在一些实施方案中，在特定的循环中检测到的第一条形码序列或第二条形码序列中的核苷酸仅对应于ON信号。在一些实施方案中，在特定的循环中检测到的第一条形码序列或第二条形码序列中的核苷酸可仅对应于OFF信号。

本文还公开了解码生物样品中的条形码序列同时最小化光学拥挤的方法，该方法包括：a)使生物样品与第一探针和第二探针接触，其中：生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，第一探针和第二探针分别直接或间接地与第一分析物和第二分析物结合，第一探针或其产物包含i)第一测序引物的第一引发位点和ii)与第一分析物相关联的第一标识符序列，并且第二探针或其产物包含i)第二测序引物的第二引发位点和ii)与第二分析物相关联的第二标识符序列；b)使用第一测序引物和第二测序引物进行第一标识符序列和第二标识符序列的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含对应于在连续测序循环中分别在第一位置和第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的信号代码，其中逐碱基测序包括在每个连续循环中使生物样品与聚合酶和包含至少一种未被可检测地标记的核苷酸的核苷酸混合物接触；和c)至少部分地基于第一信号代码序列和第二信号代码序列检测生物样品中的第一标识符序列和第二标识符序列。

在一些实施方案中，第一分析物和第二分析物可以相同或不同。在一些实施方案中，第一标识符序列和第二标识符序列是不同的。

在本文的任何实施方案中，第一标识符序列和第二标识符序列可包含分析物序列或其互补序列。在本文的任何实施方案中，第一标识符序列和第二标识符序列包含分别分配给第一分析物和第二分析物的条形码序列或其互补序列。在本文的任何实施方案中，方法可包括将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物。在一些实施方案中，分配条形码序列可基于设计成最小化在一个或多个连续循环中的每一个中检测到的ON信号的最大预测密度的决策规则。在一些实施方案中，将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物包括可基于第一分析物和第二分析物的表达数据进行分配。在一些实施方案中，将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物可包括基于聚类细胞类型中第一分析物和第二分析物的表达数据的分配。在一些实施方案中，聚类细胞类型代表存在于生物样品中的细胞类型的分布。在一些实施方案中，第一分析物和第二分析物的表达数据至少部分地重叠。在一些实施方案中，第一分析物和第二分析物的表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

在本文的任何实施方案中，核苷酸混合物可包含至少两种未被可检测地标记的核苷酸。在一些实施方案中，使生物样品以任何顺序在连续测序循环中与以下核苷酸混合物中的两种或更多种接触：核苷酸混合物1，其中包含G的核苷酸未被可检测地标记，而包含A、C或T的核苷酸被可检测地标记；核苷酸混合物2，其中包含T的核苷酸未被可检测地标记，而包含A、C或G的核苷酸被可检测地标记；核苷酸混合物3，其中包含C的核苷酸未被可检测地标记，而包含A、G或T的核苷酸被可检测地标记；和核苷酸混合物4，其中包含A的核苷酸未被可检测地标记，而包含G、C或T的核苷酸被可检测地标记。在一些实施方案中，彼此独立地，每种核苷酸混合物在一个或多个循环中与生物样品接触，其中所述循环是连续的或非连续的。在一些实施方案中，彼此独立地，在每种核苷酸混合物中，可检测地标记的核苷酸包含：i)三种不同颜色的荧光标记，三种碱基中的每一种一个颜色；ii)两种不同颜色的荧光标记，三种碱基中的两种每种一个颜色，其中包含剩余一种碱基的核苷酸用两种颜色标记；或iii)相同颜色的荧光标记，其中包含三种碱基中的一种的核苷酸上的荧光标记被配置成待切割，并且包含三种碱基中的另一种的核苷酸被配置成用荧光标记标记。

在一些实施方案中，可使生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：核苷酸混合物1，其中包含G或A的核苷酸未被可检测地标记，而包含C或T的核苷酸被可检测地标记；核苷酸混合物2，其中包含G或T的核苷酸未被可检测地标记，而包含C或A的核苷酸被可检测地标记；核苷酸混合物3，其中包含G或C的核苷酸未被可检测地标记，而包含A或T的核苷酸被可检测地标记；和核苷酸混合物4，其中包含C或A的核苷酸未被可检测地标记，而包含G或T的核苷酸被可检测地标记；核苷酸混合物5，其中包含C或T的核苷酸未被可检测地标记，而包含G或A的核苷酸被可检测地标记；和核苷酸混合物6，其中包含A或T的核苷酸未被可检测地标记，而包含G或C的核苷酸被可检测地标记。

附图说明

附图示意了本公开的某些特征和优点。这些实施方案无意于以任何方式限制所附权利要求书的范围。

图1示出了包括在原位测定中分析第一分析物和第二分析物的示例性工作流程。

图2绘示了包含引发位点和下游标识符序列(例如，条形码序列)的示例性分子和复合物，其可以使用原位逐碱基测序(例如，SBS或SBB)进行分析。作为实例示出了滚环扩增产物、平铺在分析物上的探针、杂交链反应复合物和分支结构(底部小图，从左到右)。每个分子或复合物可以包含标识符序列的多个拷贝和用于测序引物结合的3’引发位点。

图3绘示了通过顺序解码分析物的块(例如，子集)原位检测多种分析物(例如，基因)的方法。用于不同基因的给定块的探针包含共同的引发位点。

图4绘示了并行检测多种分析物(例如，基因)的方法。针对特定基因的每种探针可以包含两个或更多个不同的引发位点，并且针对任何两种不同基因的探针可以共享一个或多个共同的引发位点。

图5为根据各种实施方案使用光流体仪器分析生物样品(例如，细胞或组织样品)的示例工作流程。

具体实施方式

本申请中提及的所有出版物(包括专利文献、科学文章和数据库)均出于所有目的全文以引用方式并入本文中，并入程度如同每一单独的出版物均以引用方式单独地并入一样。如果本文阐述的定义与以引用方式并入本文中的专利、专利申请、已公布的专利申请和其他出版物中阐述的定义相反或者说相矛盾，则本文阐述的定义优先于以引用方式并入本文中的定义。

本文所使用的章节标题仅用于组织目的，而不应被解释为限制所描述的主题。

I.概述

原位检测方法的多重可扩展性可能受到光学拥挤的限制。例如，具有大尺寸和/或高强度的信号可能与其他信号重叠和/或掩盖其他信号，尤其是当信号紧挨着时，而具有小尺寸和/或弱强度的信号可能无法达到检测阈值。在任一情况下，信号检测和解码的质量都可能受到损害。另外，某些现有方法需要复杂的寡核苷酸探针池，这增加了检测和解码的成本和时间。

例如，在一些方面，单核苷酸测序化学(例如，边合成边测序(SBS)、边结合边测序(SBB)等)可以提供快速反应时间并避免对复杂的寡核苷酸探针池和顺序杂交探针池来解码例如与多重测定中的靶分析物相关联的标识符序列的需要。然而，由于信号检测和解码步骤期间的光学拥挤，故这些逐碱基测序方法在用于原位分析的多重可扩展性方面可能受到限制。特别地，在细胞或组织样品中原位并行检测大量分析物(例如，基因和/或其转录物)可能是有挑战性的。

当存在大量待检测的信号时，可能出现信号拥挤。使用其中在测序循环中每种核苷酸都产生光学信号(例如，使用荧光显微法获取的图像中的斑点)的常规逐碱基测序方法，样品可能会被紧挨着的信号斑点挤满(例如，在一定程度上重叠)，从而使得单个斑点的解析变得困难。因此，空间重叠可能限制在基于显微法的核酸测序测定中实现多重的能力。在一些方面，当一个或多个被检测到的信号显著强于(例如，具有显著更大的幅度或强度)其他信号时，可能出现信号拥挤。例如，在同一显微镜视场中，一个或多个荧光斑点可能显著强于包括相邻斑点在内的其他斑点。当样品中存在太多信号斑点时，或者当一个信号的幅度显著大于另一个信号的幅度时，可能难以准确和可靠地检测同一视场和/或同一检测通道(例如，同一荧光通道)中的所有信号。在一些情况下，信号拥挤可能导致较弱的(例如，较低幅度的)或重叠的信号被掩盖和/或漏失，这最终导致来自样品中分析物的信息的丢失。在这样的情况下，检测的有效动态范围可能减小。

在一些实施方案中，本文提供了可以用于在原位逐碱基序列测定期间防止和/或解决与光学拥挤相关联的问题的方法和组合物。

在一些实施方案中，本文提供了一种分析细胞或组织样品的方法，其中对各种分析物的标识符序列(例如，核酸分析物的序列，或分析物靶向探针中的条形码序列)原位测序，从而检测细胞或组织样品中一个或多个位置处的相应分析物。在一些实施方案中，为了检测原位测序的多种分析物的标识符序列，对应于至少两个不同标识符序列的信号在循环之间交错。在一些实施方案中，使用SBS或SBB或任何其他逐碱基测序化学(例如，亲合力测序)在逐碱基测序循环中解码标识符序列。在一些实施方案中，对于许多(例如，大多数)逐碱基测序循环，在特定的循环中仅检测与有限数量的分析物相关联的信号，而与许多(例如，大多数)其他分析物相关联的信号在该特定循环中是暗的。例如，在特定的循环中当与分析物的标识符序列中的核苷酸碱基配对的同源核苷酸的掺入(例如，在SBS中)或结合(例如，在SBB中)不生成可检测信号时，则该分析物在该循环中可能是暗的。在一些实施方案中，同源核苷酸包含碱基并且未被可检测地标记(例如，生成OFF信号)，而包含一种或多种其他不同碱基的核苷酸被可检测地标记(例如，各自生成ON信号)。

在一些实施方案中，使用本文公开的方法，在细胞或组织样品中的第一位置处检测到ON信号，并且在细胞或组织样品中的第二位置处检测到OFF信号。在一些实施方案中，第一位置和第二位置不重叠。在一些实施方案中，第一位置和第二位置至少部分地重叠。在一些实施方案中，标识符序列使得在同一逐碱基测序循环中要检测的标识符序列中只有一部分核苷酸产生可检测信号，从而限制在该循环中检测到的信号的光学拥挤。

本文提供了涉及使用一种或多种多核苷酸(例如，可环化探针诸如挂锁探针)来分析细胞或生物样品如组织样品中存在的一种或多种分析物(例如，一种或多种信使RNA)的方法。还提供了根据所提供的方法使用的探针、探针组、组合物、试剂盒、系统和装置。在一些方面，所提供的方法和系统可以应用于测序、检测、成像、定量和/或确定一种或多种分析物(例如，靶核酸)或其部分的存在。在一些方面，所提供的方法和系统可以应用于并行地对多种分析物或与其相关联的标识符序列原位测序，同时减少样品中生成的信号的光学拥挤。

在一些实施方案中，用于分析生物样品的示例性工作流程包括使生物样品与第一探针和第二探针接触，其中生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，并且其中第一探针和第二探针分别直接或间接地与第一分析物和第二分析物结合。在一些实施方案中，第一探针和第二探针经历连接、环化和扩增以形成第一产物和第二产物。在一些方面，扩增为滚环扩增并且形成的产物为第一滚环扩增产物(RCP)和第二滚环扩增产物。在一些实施方案中，每种探针的产物为在生物样品中原位生成的滚环扩增(RCA)产物。在一些实施方案中，第一探针或其产物包含i)第一测序引物的第一引发位点和ii)与第一分析物相关联的第一标识符序列，并且第二探针或其产物包含i)第二测序引物的第二引发位点和ii)与第二分析物相关联的第二标识符序列。在一些实施方案中，第一标识符序列为第一条形码序列或其互补序列，并且第二标识符序列为第二条形码序列或其互补序列。

在一些实施方案中，用于分析生物样品的示例性工作流程包括分别使用第一测序引物和第二测序引物以及循环系列的核苷酸掺入或核苷酸结合步骤进行第一标识符序列和第二标识符序列的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含各自对应于在连续循环中分别在第一位置和第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的一系列信号代码，其中在连续循环中的一个或多个中，在第一位置处检测到ON信号并且在第二位置处检测到OFF信号。在一些实施方案中，方法包括基于第一信号代码序列和第二信号代码序列检测生物样品中的第一标识符序列和第二标识符序列。在一些实施方案中，方法包括基于第一信号代码序列和第二信号代码序列检测扩增产物或其部分(例如，RCA产物)。在一些方面，第一标识符序列(例如，条形码序列)鉴定第一分析物，并且/或者第二条形码序列鉴定第二分析物。

在一些实施方案中，用于分析生物样品的示例性工作流程包括使第一测序引物与第一引发位点杂交并且进行逐碱基测序以生成第一测序引物的延伸产物和第一信号代码序列，去除(例如，剥离)、切割或阻断(例如，通过对最后的循环使用终止子核苷酸)第一测序引物的延伸产物使得逐碱基测序被阻止，和使第二测序引物与第二引发位点杂交并且进行逐碱基测序以生成第二测序引物的延伸产物和第二信号代码序列。在一些实施方案中，第一引发位点和第二引发位点是不同的。在一些实施方案中，针对第一多种分析物的探针或其扩增产物共享共同的第一引发位点，并且针对第二多种分析物的探针或其扩增产物共享共同的第二引发位点。第二多种分析物可包含两种或更多种不同的分析物，这些分析物与第一多种分析物中的两种或更多种不同的分析物不同。

在一些实施方案中，用于分析生物样品的示例性工作流程包括使生物样品与多种探针接触，所述多种探针各自被配置成直接或间接地与不同的分析物结合。在一些实施方案中，每种探针或其滚环扩增产物包含两个或更多个不同引发位点的组合。在一些实施方案中，第一探针或其产物包括包含第一引发位点的两个或更多个不同引发位点的第一组合，并且/或者第二探针或其产物包括包含第二引发位点的两个或更多个不同引发位点的第二组合。在一些实施方案中，两个或更多个不同引发位点的第一组合和两个或更多个不同引发位点的第二组合可共享一个或多个共同的引发位点。在一些实施方案中，用于分析生物样品的示例性工作流程包括使生物样品与第一测序引物接触并分别使用循环系列的核苷酸掺入或结合进行逐碱基测序，从而生成第一测序引物的延伸产物和第一多种分析物的可检测信号代码序列，去除、切割或阻断第一测序引物的延伸产物，和使生物样品与第二测序引物接触并分别使用循环系列的核苷酸掺入或结合进行逐碱基测序，从而生成第二测序引物的延伸产物和不同于第一多种分析物的第二多种分析物的可检测信号代码序列。

在一些实施方案中，用于分析生物样品的示例性工作流程包括使生物样品与第一探针和第二探针接触，其中：生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，第一探针以直接或间接地与第一分析物结合的第一多种探针提供，第二探针以直接或间接地与第二分析物结合的第二多种探针提供，并且其中第一多种探针共同包含条形码序列的第一组合，第二多种探针共同包含条形码序列的第二组合。在一些实施方案中，第一多种探针和第二多种探针包含用于结合多种第一测序引物和第二测序引物的引发位点的第一组合和第二组合。在一些实施方案中，示例性方法包括分别使用多种第一测序引物和第二测序引物以及循环系列的核苷酸掺入或核苷酸结合步骤进行条形码序列的第一组合和第二组合的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含各自对应于在连续循环中分别在第一位置和第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的一系列信号代码，其中在连续循环中的一个或多个中，在第一位置处检测到ON信号并且在第二位置处检测到OFF信号。在一些实施方案中，示例性方法包括基于第一信号代码序列和第二信号代码序列检测生物样品中条形码序列的第一组合和第二组合。在一些实施方案中，条形码序列的第一组合鉴定第一分析物，条形码序列的第二组合鉴定第二分析物。

II.标识符序列

在一些实施方案中，本文提供了用于通过检测样品中分析物的标识符序列来分析样品中的多种分析物的方法和组合物。在一些实施方案中，标识符序列存在于样品中的分析物例如DNA或RNA分析物中或源自样品中的分析物例如DNA或RNA分析物。例如，标识符序列可以是DNA或RNA分析物序列的一部分。在一些实施方案中，标识符序列可以是分析物序列(诸如挂锁探针的臂，或缺口填充序列)或其互补序列。在一些实施方案中，分析物可以包含两种或更多种不同的标识符序列。在一些实施方案中，分析物可以包含相同标识符序列的两个或更多个拷贝。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以通过磷酸二酯键直接连接。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以由一个或多个核苷酸残基彼此分开。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以部分地重叠。

在一些实施方案中，标识符序列存在于标记剂中，例如包含标识符序列的核酸探针中，或与包含标识符序列的报告寡核苷酸缀合的抗体中。在一些实施方案中，标记剂可包括直接或间接地与分析物(例如，样品中的内源性分析物)相互作用(例如，结合和/或反应)的结合部分。在一些实施方案中，标记剂可以包含指示与结合部分相互作用的分析物或其部分的报告寡核苷酸。例如，报告寡核苷酸可包含允许鉴定结合部分和相应分析物的条形码序列(作为标识符序列)。在一些情况下，与标记剂接触的样品可以进一步与与标记剂的报告寡核苷酸杂交的核酸探针接触。在一些实施方案中，标记剂包含一种或多种条形码序列，例如对应于分析物结合部分和/或分析物的条形码序列。在一些实施方案中，条形码序列与分析物结合部分相关联或以其他方式鉴定分析物结合部分。在一些实施方案中，通过鉴定其相关联的条形码序列来鉴定分析物结合部分，可以鉴定分析物结合部分所结合的分析物。在一些实施方案中，条形码序列可以是给定长度的核酸序列和/或与分析物结合部分相关联、对应于分析物结合部分和/或鉴定分析物结合部分的序列。条形码序列通常可以包括本文(例如，在第II-B节中)描述的条形码序列的各种方面中的任何一个。

在一些实施方案中，标识符序列存在于样品中的DNA或RNA分析物的产物中。例如，标识符序列可以存在于样品中的DNA或RNA分析物的杂交产物、连接产物、延伸产物(例如，通过DNA或RNA聚合酶)、复制产物、转录/逆转录产物和/或扩增产物诸如滚环扩增(RCA)产物中。

在一些实施方案中，标识符序列存在于标记剂的产物中。在一些实施方案中，标识符序列存在于核酸探针的产物中。在一些实施方案中，标识符序列存在于标记剂的报告寡核苷酸的产物中。例如，标识符序列可以存在于样品中的核酸探针或报告寡核苷酸的杂交产物、连接产物、延伸产物(例如，通过DNA或RNA聚合酶)、复制产物、转录/逆转录产物和/或扩增产物诸如滚环扩增(RCA)产物中。

在一些实施方案中，样品中的DNA或RNA分析物、核酸探针和/或报告寡核苷酸的产物可以包含两种或更多种不同的标识符序列。在一些实施方案中，产物可以包含相同标识符序列的两个或更多个拷贝。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以在相同的分子中或在不同的分子(例如，经由杂交形成复合物诸如分支结构的分子)中。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以通过磷酸二酯键直接连接。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以由一个或多个核苷酸残基彼此分开。在一些实施方案中，不同的标识符序列和/或相同标识符序列的拷贝可以部分地重叠。产物可以在样品中(例如，原位)生成，或者产物的至少一部分可以在样品外生成并然后与样品接触。产物可以通过酶促和/或非酶促方式生成。示例性的产物包括但不限于RCA产物、杂交链反应(HCR)产物、线型寡核苷酸杂交链反应(LO-HCR)产物、分支DNA反应(bDNA)产物、引物交换反应(PER)产物或使用这些酶促和/或非酶促反应的任何组合生成的产物，例如，如第II-C节中所述。

本文的标识符序列可以是连续序列或者在同一分子中或在单独的分子中包含两种或更多种序列。当在同一分子中时，所述两种或更多种序列可以由一个或多个核苷酸残基分开。

本文的标识符序列可以具有任何合适的长度。在一些实施方案中，标识符序列的长度在约1至约500个核苷酸之间。在一些实施方案中，标识符序列的长度为约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195或约200个核苷酸或所指示的值之间的任何整数(或整数范围)的核苷酸。

在一些实施方案中，在细胞或组织样品的特定位置处，分子或复合物包含与样品中该特定位置处的分析物相关联、对应于样品中该特定位置处的分析物和/或鉴定样品中该特定位置处的分析物的标识符序列的多个拷贝。在一些实施方案中，使用逐碱基测序检测标识符序列的多个拷贝，并且信号被用于鉴定分析物。在一些实施方案中，分子或复合物包含与分析物相关联、对应于分析物和/或鉴定分析物的至少2、至少5、至少10、至少15、至少20、至少25种或更多种不同的标识符序列。在一些实施方案中，分子或复合物包含所述一种或多种标识符序列中的每一种的至少2、至少5、至少10、至少25、至少50、至少100、至少250、至少500、至少1,000、至少2,500、至少5,000个或更多个拷贝。包含一种或多种不同的标识符序列的示例性分子和复合物在第II-C节中描述。

在一些实施方案中，在细胞或组织样品中检测到多种分析物，并且可以使用标识符序列或标识符序列的组合来鉴定每种分析物。在一些实施方案中，样品中待检测的不同分析物的数量为至少5、至少10、至少25、至少50、至少100、至少250、至少500、至少1,000、至少2,500、至少5,000或更多。在一些实施方案中，用于鉴定样品中的多种分析物的不同标识符序列的数量为至少5、至少10、至少25、至少50、至少100、至少250、至少500、至少1,000、至少2,500、至少5,000或更多。

A.来自分析物的标识符序列

在一些实施方案中，本文的标识符序列包括分析物序列、分析物来源的序列或其互补序列。在一些实施方案中，分析物包含核酸序列，标识符序列包括分析物中的核酸序列或核酸序列的互补序列。

在一些实施方案中，标识符序列包括病毒或细胞核酸的序列。在一些实施方案中，标识符序列包括病毒DNA或RNA的序列。在一些实施方案中，标识符序列在病毒或病毒颗粒中(例如，在细胞或组织样品中)或来自病毒或病毒颗粒。在一些实施方案中，标识符序列包括细胞DNA或RNA的序列。在一些实施方案中，细胞DNA或RNA在原核细胞中(例如，在组织样品中)或来自原核细胞。在一些实施方案中，细胞DNA或RNA在真核细胞中(例如，在组织样品中)或来自真核细胞。在一些实施方案中，标识符序列包括在核、线粒体或叶绿体中或来自核、线粒体或叶绿体的核酸分子的序列。在一些实施方案中，标识符序列包括基因组DNA、细胞RNA或cDNA的序列。在一些实施方案中，标识符序列包括编码RNA和/或非编码RNA的序列。在一些实施方案中，标识符序列包括信使RNA(mRNA)的序列，包括新生RNA、前mRNA、初级转录RNA以及加工的RNA(诸如加帽mRNA(例如，具有5′7-甲基鸟苷帽)、聚腺苷酸化mRNA(在3′末端的聚A尾)和一个或多个内含子已去除的剪接mRNA)。在一些实施方案中，标识符序列包括非加帽mRNA、非聚腺苷酸化mRNA或非剪接mRNA的序列。在一些实施方案中，标识符序列包括存在于细胞或组织样品中的另一个核酸分子(例如，DNA或RNA，诸如病毒RNA)的转录物的序列。在一些实施方案中，标识符序列包括非编码RNA的序列，并且不翻译成蛋白质的非编码RNA(ncRNA)的实例包括转移RNA(tRNA)和核糖体RNA(rRNA)，以及小的非编码RNA，诸如微小RNA(miRNA)、小干扰RNA(siRNA)、Piwi相互作用RNA(piRNA)、小核仁RNA(snoRNA)、小核RNA(snRNA)、细胞外RNA(exRNA)、小卡哈尔体(Cajal body)特异性RNA(scaRNA)和长ncRNA(诸如Xist和HOTAIR)。在一些实施方案中，标识符序列包括小RNA(例如，长度小于200个核酸碱基)或大RNA(例如，长度大于200个核酸碱基的RNA)的序列。小RNA的实例包括5.8S核糖体RNA(rRNA)、5S rRNA、tRNA、miRNA、siRNA、snoRNA、piRNA、tRNA衍生的小RNA(tsRNA)和小rDNA衍生的RNA(srRNA)。RNA可以包括双链RNA或单链RNA。RNA可以是环状RNA。RNA可以是细菌rRNA(例如，16s rRNA或23s rRNA)。在一些实施方案中，标识符序列包括跨越外显子-外显子连接点的序列，例如在剪接RNA中。在一些实施方案中，标识符序列包括跨越内含子-外显子或外显子-内含子连接点的序列，例如在DNA或非剪接RNA中。在一些实施方案中，标识符序列可以包括本文公开的任何RNA的逆转录产物的序列。在一些实施方案中，标识符序列可以包括本文公开的任何RNA的cDNA或cDNA的互补序列。

在一些实施方案中，核酸分析物或其互补序列例如使用非模板依赖性连接来进行环化，并用作滚环扩增(RCA)的模板。例如，由细胞或组织样品中的mRNA的逆转录产生的cDNA可以使用单链DNA连接酶(例如，CircLigase^TM)直接环化并用作RCA的模板。在一些情况下，不需要事先了解mRNA，并且可以使用直接连接方法来对全转录组原位取样。RCA产物包含cDNA的互补序列(即，逆转录以生成cDNA的mRNA的序列)，其可以是使用本文公开的方法测序以检测细胞或组织样品中的位置处的相应mRNA的标识符序列。

在一些实施方案中，将可环化探针或探针组与核酸分析物(例如，cDNA或mRNA)杂交，并使用核酸分析物作为模板进行连接以形成环化探针，在连接之前进行或不进行缺口填充。在一些实施方案中，可环化探针或探针组包含与核酸分析物(例如，cDNA或mRNA)杂交的3’杂交区和5’杂交区(例如，3’臂和5’臂)。在一些实施方案中，在与核酸分析物杂交后，可环化探针或探针组的3’末端核苷酸和5’末端核苷酸被配置成在通过聚合酶(例如，具有DNA聚合酶或逆转录酶活性的酶)进行缺口填充之后连接。在一些实施方案中，可环化探针或探针组的3’杂交区和5’杂交区与核酸分析物(例如，cDNA或mRNA)中未通过磷酸二酯键直接连接的序列互补，并且在两个杂交区之间形成一个或多个核苷酸的缺口。在一些实施方案中，缺口的长度在约1至约500个核苷酸之间。在一些实施方案中，缺口的长度为约5、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155、约160、约165、约170、约175、约180、约185、约190、约195或约200个核苷酸或所指示的值之间的任何整数(或整数范围)的核苷酸。在一些实施方案中，缺口的长度在约200至约300个核苷酸之间、约300至约400个核苷酸之间、或约400至约500个核苷酸之间。在一些实施方案中，在与核酸分析物(例如，cDNA或mRNA)杂交后，在可环化探针或探针组的3’与5’末端之间形成一个或多个缺口，例如，可以使用核酸分析物作为模板来填充两个、三个或更多个缺口。

在一些实施方案中，核酸分析物为DNA(例如，cDNA)并且缺口由具有DNA聚合酶活性的酶填充。在一些实施方案中，核酸分析物为RNA(例如，mRNA)并且缺口由具有逆转录酶活性的酶填充。在一些实施方案中，酶的缺口填充将核酸分析物(例如，cDNA或mRNA)的序列拷贝到由可环化探针或探针组形成的环化探针中。在一些实施方案中，因为缺口侧接已知序列，所以可以使用本文公开的方法读出核酸分析物序列或其互补序列(例如，“细胞条形码”)作为核酸分析物的标识符序列。例如，来自核酸分析物的标识符序列的3’处的已知序列可以提供用于结合本文公开的测序引物的引发位点，并且可以逐碱基地对标识符序列测序。

在一些实施方案中，可以将一种或多种条形码序列构建到可环化探针或探针组的骨架中，例如，以区分靶向相同核酸分析物或不同核酸分析物(例如，cDNA或mRNA)的可环化探针(例如，挂锁探针)。在一些实施方案中，除了标识符序列(例如，“细胞条形码”)之外，还可以使用本文公开的逐碱基测序方法读出来自探针或探针组的一种或多种条形码序列。在一些实施方案中，在环化探针中，条形码序列与使用缺口填充生成的标识符序列(例如，与核酸分析物的序列互补的序列)相邻，并且条形码序列和标识符序列都可以原位测序，例如，通过对环化探针的RCA产物中的相应序列进行逐碱基测序。可以使用相同的测序引物或使用单独的测序引物对相邻的条形码序列和标识符序列测序。在一些实施方案中，在环化探针中，可环化探针的3’或5’杂交区序列在相邻的条形码序列和标识符序列之间，并且3’或5’杂交区序列(已知序列)可以用作引发位点或可以作为对照被测序。

用于生成包含源自核酸分析物(例如，基因组DNA、mRNA或cDNA)的标识符序列的环化探针及其RCA产物的示例性方法包括但不限于以下文献中描述的那些：Chen等人，Efficient in situ barcode sequencing using padlock probe-based BaristaSeq，Nucleic Acid Research(2018)46(4)：e22；Lee等人，Fluorescent in situ sequencing(FISSEQ)of RNA for gene expression profiling in intact cells and tissues，Nature Protocols(2015)10：442-458；Lee等人，Highly multiplexed subcellular RNAsequencing in situ，Science(2014)343：1360-1363；US 10,138,509；US 10,179,932；US10,494,662；US 11,078,520；和US 11,085,072，所有这些文献均以引用方式并入本文。

B.条形码序列作为标识符序列

在一些实施方案中，本文提供了一种方法，其包括使细胞或组织样品与多种探针接触，每种探针直接或间接地与样品中的不同分析物结合。在一些实施方案中，每种探针可以包含：i)用于与其相应的分析物直接或间接结合的杂交序列(或分析物结合部分，诸如抗体或抗体片段)和ii)与相应的分析物相关联、对应于相应的分析物和/或鉴定相应的分析物的一种或多种标识符序列。在一些实施方案中，所述一种或多种标识符序列不是源自相应的分析物，而是分配给相应的分析物的条形码序列。在一些情况下，给相应的分析物分配标识符序列提供优于内源性分析物的序列的某些优点，因为允许设计包含所需数量和/或种类(例如，A、T、C或G)的核苷酸的标识符序列，其中大多数(例如，70％或更多)可以与OFF信号相关联。在一些情况下，使用条形码序列代替内源性分析物的序列允许设计多种条形码序列，这些条形码序列共同减少在连续解码循环中检测到的信号的光学拥挤(例如，通过使得在所述多种条形码序列之间在同一循环中分析的碱基中具有足够数量的“OFF”碱基)并便于明确的分析物鉴定。

在一些实施方案中，在条形码测序方法中，检测条形码序列以鉴定包含比条形码序列本身更长的核酸分子(DNA或RNA)的其他分子，这与直接测序更长的核酸分子相反。在一些实施方案中，给定N个碱基的测序读段，N聚体条形码序列包含4^N的复杂性，并且与非条形码测序方法诸如直接测序相比，分子鉴定可能需要短得多的测序读段。例如，使用5个核苷酸的条形码序列可以鉴定1024种分子物类(4⁵＝1024)，而8个核苷酸的条形码可以用于鉴定多达65,536种分子物类，这个数字大于人类基因组中不同基因的总数。在一些实施方案中，检测条形码序列(例如，在探针或RCA产物中所含的)而不是内源序列，这就每个测序循环的信息而言可以是有效的读段。在一些实施方案中，因为条形码序列是预先确定的，所以它们也可以被设计成表征错误检测和纠正机制，参见例如美国专利公开20190055594以及美国专利公开20210164039，其据此全文以引用方式并入。

在一些方面，分析物可以与一种或多种条形码序列(例如，至少两种、三种、四种、五种、六种、七种、八种、九种、十种或更多种不同的条形码序列)相关联、对应于一种或多种条形码序列和/或使用一种或多种条形码序列来鉴定。可以如第III节中所述将条形码序列分配给分析物。

在一些实施方案中，单种条形码序列可以唯一地鉴定多种不同分析物中的一种分析物。在一些实施方案中，可以将两种或更多种不同的条形码序列分配给相同的分析物，并且任何条形码序列都可以唯一地鉴定多种不同分析物中的一种分析物。在一些实施方案中，单种条形码序列以条形码序列的组合提供，其中所述组合可以唯一地鉴定多种不同分析物中的一种分析物。条形码序列的组合可以在两种或更多种探针分子中提供。在一些实施方案中，核酸探针群体中的不同条形码序列的数量小于核酸探针的不同靶分析物(例如，核酸分析物和/或蛋白质分析物)的数量，但不同的靶分析物仍然可以例如通过用条形码序列的不同组合编码探针而从彼此唯一地鉴定。然而，并非需要使用给定的一组条形码序列的所有可能组合。例如，每种探针可以含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个等或更多个条形码序列。在一些实施方案中，例如核酸探针的群体可以各自含有相同数量的条形码序列，但在其他情况下，各种探针上可以存在不同数量的条形码序列。

作为说明性实例，第一探针可以含有第一靶结合序列(或第一靶结合部分)、第一条形码序列和第二条形码序列，而第二不同的探针可以含有第二靶结合序列或靶结合部分(其不同于第一探针中的第一靶结合序列(或靶结合部分))、与第一探针中相同的第一条形码序列、但第三条形码序列而不是第二条形码序列。由此可以通过确定样品中给定位置处存在的或与给定探针相关联的各种条形码序列组合来区分此类探针。

可以将条形码序列以可逆或不可逆方式附接至分析物或另一个部分或结构。在一些方面，条形码序列可以包含约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个或多于30个核苷酸。

在一些实施方案中，探针诸如核酸探针(或被配置成靶向相同的分析物的核酸探针的组合)可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15种或更多种、20种或更多种、32种或更多种、40种或更多种、或50种或更多种不同的条形码序列。在一些实施方案中，核酸探针或核酸探针的组合可包含特定条形码序列的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个、20个或更多个、32个或更多个、40个或更多个、或50个或更多个拷贝。不同的条形码序列或相同的条形码序列的拷贝可以定位在核酸探针内或核酸探针之间的任何地方。如果存在多于一种条形码序列或多于一个拷贝，则条形码序列或拷贝可以彼此相邻定位，和/或与其他序列穿插。在一些实施方案中，条形码序列或拷贝中的两个或更多个也可以至少部分地重叠。在一些实施方案中，同一探针中的两个或更多个条形码序列或拷贝不重叠。在一些实施方案中，同一探针中的任何两个或更多个或所有条形码序列或拷贝可以由至少一个磷酸二酯键彼此分开(例如，它们可以彼此紧邻但不重叠)，诸如分开1、2、3、4、5、6、7、8、9、10个或更多个核苷酸。

条形码序列可以具有任何长度。在一些实施方案中，条形码序列可独立地具有相同或不同的长度，诸如至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少20、至少25、至少30、至少35、至少40、至少50个核苷酸。在一些实施方案中，单个条形码序列的长度可不超过24、不超过16、不超过15、不超过14、不超过13、不超过12、不超过10、不超过9或不超过8个核苷酸。任何这些的组合也是可能的，例如，条形码序列可以在5至10个核苷酸之间、8至15个核苷酸之间等。

在一些实施方案中，条形码序列可以包含一起充当单个条形码序列的两个或更多个子条形码序列。例如，多核苷酸可以包含被一种或多种非条形码序列分开的两种或更多种多核苷酸序列(例如，子条形码序列)。在一些实施方案中，条形码序列还可以提供用于靶向功能的平台，诸如寡核苷酸、寡核苷酸-抗体缀合物、寡核苷酸-链霉亲和素缀合物、经修饰的寡核苷酸、亲和纯化、可检测部分、酶、用于检测测定或其他功能的酶和/或用于检测和鉴定包含条形码序列或直接或间接地与条形码序列结合的多核苷酸的酶。

条形码序列可以是任意的或随机的。在某些情况下，条形码序列选择为减少或最小化与样品中其他组分的同源性，例如，使得条形码序列本身不与怀疑在细胞或其他样品内的其他核酸结合或杂交。在一些实施方案中，在特定的条形码序列与另一序列(例如，样品中的细胞核酸序列或添加到样品中的探针中的其他条形码序列)之间，同源性可以小于10％、小于8％、小于7％、小于6％、小于5％、小于4％、小于3％、小于2％或小于1％。在一些实施方案中，同源性可以小于20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3或2个碱基，并且在一些实施方案中，所述碱基为连续碱基。

在一些实施方案中，本文公开的核酸探针和探针中的条形码序列可以使用4个碱基中的仅2个或仅3个来制备，诸如在探针内将所有“G”排除在外和/或将所有“C”排除在外。缺少“G”或“C”的序列可以形成非常小的二级结构，并且在某些实施方案中可以有助于更均匀、更快速的杂交。

在一些实施方案中，在循环原位解码过程期间检测到的信号组可以用于生成对应于分配给分析物的条形码序列的信号代码序列，并且可以将信号代码序列与代码本中的代码字进行比较以鉴定匹配。在一些情况下，代码本中的代码字可以对应于物理条形码，所述物理条形码包括一系列ON和/或OFF位，这些位对应于在解码过程期间在连续循环中获取的图像中检测到的一系列ON和OFF信号。然后，可以从在样品的一系列图像中的每个特定位置处检测到的信号代码序列以及每个信号代码序列的相应ON和OFF信号的检测位置推断出一种或多种靶分析物的存在和位置。在一些方面，信号代码序列的信号代码可以包括例如信号(ON信号)、信号缺失(OFF信号)或其组合。

可以设计包含代码字(对应于标识符序列或“物理”核酸条形码序列)的代码本以满足一组特定的设计标准。例如，可以设计代码本以确保其包含指定数量(或最小数量)的唯一代码字/条形码序列(例如，对应于指定数量(或最小数量)的待鉴定靶分析物)。在一些情况下，例如，代码本可包括至少2、至少5、至少10、至少20、至少40、至少60、至少80、至少100、至少200、至少400、至少600、至少800、至少1,000、至少2,000、至少4,000、至少6,000、至少8,000、至少10,000、至少20,000、至少40,000、至少60,000、至少80,000、至少100,000、至少200,000、至少400,000、至少600,000、至少800,000、至少1,000,000、至少2x10⁶、至少3x10⁶、至少4x10⁶、至少5x10⁶、至少6x10⁶、至少7x10⁶、至少8x10⁶、至少9x10⁶、至少10⁷、至少10⁸、至少10⁹个或多于10⁹个独特代码字/条形码序列。在一些情况下，代码本可以包括本段中的值的范围内的任何数量的唯一代码字/条形码序列。

在一些情况下，给定代码本中的代码字/条形码序列可被设计成满足指定的成对编辑距离(例如，指定的最小成对编辑距离)以使得能够实现条形码错误检测和纠正。“编辑距离”是通过对将一个字符串变换为另一字符串所需的最少编辑操作数量进行计数来定量两个字符串(例如，文本字符串)彼此有多大差异的数值。编辑距离度量的实例包括但不限于汉明距离、莱文斯坦距离、最长公共子序列(LCS)距离等。例如，两个字符串之间的莱文斯坦距离是将一个字符串变换为另一字符串所需的最少单字符编辑(例如，插入、缺失或取代)数量。最长公共子序列(LCS)距离是唯一允许的编辑操作为插入和缺失(为其每一者分配单位成本)的编辑距离。相等长度的两个字符串之间的汉明距离(即，取代是允许的唯一编辑操作)为两个字符串中的对应符号不同的位置的数量。

汉明距离和/或莱文斯坦距离(其中为两个字符串之间的差异赋予的错误罚分为整数值)允许对错误纠正的自然解释，其中2k+1的最小成对条形码距离允许纠正至多k个错误。在一些情况下，给定代码本的设计条形码可能需要具有最小成对编辑距离(例如，最小成对汉明距离、最小成对莱文斯坦距离或最小成对LCS距离)使得它们保证纠正至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个条形码错误(例如，在解码过程期间出现的错误)的错误纠正能力。

在一些情况下，期望设计代码本使得用于解码的图像中的光学拥挤最小化。例如，在一些情况下，可设计一组代码字/条形码使得该组代码字/条形码的ON信号(或组合权重)在多个解码循环内或多或少地均匀分布。在一些情况下，可设计代码本中的代码字/条形码使得在任何给定的解码循环期间至多一个位为ON。例如，设计用于四“颜色”(例如，四个检测通道)解码仪器的代码本中的代码字/条形码可包含每个解码循环的4位块(每个检测通道一个)，其中在任何给定循环内至多一个位为ON。本文描述的“颜色”可以包括荧光显微法中使用的任何颜色，以及暗或OFF状态(例如，无可检测信号)。

在一些实施方案中，可以选择对应于代码字的条形码序列内的核苷酸以减少循环中检测到的信号的光学拥挤。例如，在多种条形码序列中，可以选择待在同一逐碱基测序循环中检测的相应核苷酸以减少在该循环中检测到的信号的光学拥挤，并且可以设计多种条形码序列使得多个(例如，大多数)循环中的光学拥挤得到限制。在一些实施方案中，对于每个循环，在其中，代表第一条形码序列中的核苷酸的信号代码(例如，第一颜色的信号、第二颜色的信号、第三颜色的信号、或信号缺失)为ON信号，代表第二条形码序列中的相应核苷酸的信号代码为OFF信号。在一些实施方案中，暗或OFF状态可以包括在一种或多种代码字/条形码序列中，并且使用用于循环逐碱基测序的核苷酸混合物来检测暗或OFF状态。在一些实施方案中，使用任何合适的方案(例如，如第III.A节中所述)将条形码序列分配给多种分析物中的每一种。

C.包含标识符序列的分子或复合物

标识符序列，包括来自分析物的那些和分配给分析物的条形码序列，可以存在于各种分子或其复合物中并使用原位逐碱基测序进行检测。本文描述了示例性的分子和复合物。

(i)标记剂

在本文描述的方法和系统中，可以使用能够与一种或多种特征结合或以其他方式偶联的一种或多种标记剂来表征分析物、细胞和/或细胞特征。在一些情况下，细胞特征包括细胞表面特征。分析物可以包括但不限于蛋白质、受体、抗原、表面蛋白、跨膜蛋白、分化蛋白簇、蛋白通道、蛋白泵、载体蛋白、磷脂、糖蛋白、糖脂、细胞-细胞相互作用蛋白质复合物、抗原呈递复合物、主要组织相容性复合物、工程化T细胞受体、T细胞受体、B细胞受体、嵌合抗原受体、缺口连接、粘附连接或它们的任何组合。在一些情况下，细胞特征可以包括细胞内分析物，诸如蛋白质、蛋白质修饰(例如，磷酸化状态或其他翻译后修饰)、核蛋白、核膜蛋白或它们的任何组合。在一些实施方案中，所述方法包括在使样品与一种或多种标记剂接触之后的一个或多个后固定(post-fixing，也称为post-fixation)步骤。

在一些实施方案中，标记剂包含能够与分析物(例如，生物分析物，例如，大分子组成成分)结合的分析物结合部分。结合部分可包括但不限于蛋白质、肽、抗体(或其表位结合片段)、亲脂部分(诸如胆固醇)、细胞表面受体结合分子、受体配体、小分子、双特异性抗体、双特异性T细胞衔接体、T细胞受体衔接体、B细胞受体衔接体、抗体前药、适体、单抗体、affimer、darpin和蛋白质支架或它们的任何组合。结合部分可以直接或间接地附接至指示结合部分所结合的分析物或特征的报告寡核苷酸。例如，报告寡核苷酸可包含允许鉴定结合部分和相应分析物的条形码序列。例如，对一种类型的分析物或细胞特征有特异性的标记剂可以具有与之偶联的第一报告寡核苷酸，而对不同的分析物或细胞特征有特异性的标记剂可以具有与之偶联的不同报告寡核苷酸。关于示例性标记剂、报告寡核苷酸和使用方法的描述，参见例如美国专利10,550,429；美国专利公开20190177800；以及美国专利公开20190367969，这些专利均全文以引用方式并入本文。

在一些实施方案中，分析物结合部分包含一个或多个核酸部分。所述一个或多个核酸部分可以经由核酸杂交与靶分析物(例如，靶核酸)特异性结合。在一些实施方案中，分析物结合部分包含一种或多种抗体或其表位结合片段。包括分析物结合部分的抗体或表位结合片段可以与靶分析物特异性结合。在一些实施方案中，分析物为蛋白质(例如，生物样品(例如，细胞)表面上的蛋白质或细胞内蛋白质)。

在一些实施方案中，包含多种分析物结合部分的多种分析物标记剂结合生物样品中存在的多种分析物。在一些实施方案中，多种分析物包括分析物的单种物类(例如，多核苷酸或多肽的单种物类)。在其中多种分析物包括分析物的单种物类的一些实施方案中，多种分析物标记剂的分析物结合部分是相同的。在其中多种分析物包括分析物的单种物类的一些实施方案中，多种分析物标记剂的分析物结合部分是不同的(例如，多种分析物标记剂的成员可以具有分析物结合部分的两种或更多种物类，其中分析物结合部分的两种或更多种物类中的每种物类结合分析物的单种物类，例如在不同的结合位点)。在一些实施方案中，多种分析物包括分析物的多种不同物类(例如，多核苷酸或多肽的多种不同物类)。

在其他情况下，例如，为了便于样品复用，可以使用对特定分析物或细胞特征有特异性的标记剂的不同子集。例如，标记剂的第一子集包含与第一报告寡核苷酸偶联的结合部分(例如，核酸或抗体或亲脂性部分)，并且标记剂的第二子集包含与不同于第一报告寡核苷酸的第二报告寡核苷酸偶联的结合部分。

在一些方面，这些报告寡核苷酸可包含核酸条形码序列，这些核酸条形码序列允许鉴定报告寡核苷酸与之偶联的结合部分。将寡核苷酸选择为报告子可提供以下优点：能够在序列方面生成显著多样性，同时还可附接至大多数生物分子，例如，核酸和抗体等，而且是可检测的，例如，使用本文描述的原位检测技术。

报告寡核苷酸与结合部分的附接(偶联)可通过多种直接或间接、共价或非共价缔合或附接中的任何一种来实现。例如，寡核苷酸可使用化学缀合技术(例如，可从InnovaBiosciences获得的Lightning-抗体标记试剂盒)共价附接至结合部分(诸如蛋白质，例如抗体或抗体片段)的一部分，以及使用其他非共价附接机制进行附接，例如使用生物素酰化抗体和带有亲和素或链霉亲和素接头的寡核苷酸(或包括偶联至寡核苷酸的一个或多个生物素酰化接头的珠粒)。抗体和寡核苷酸生物素酰化技术是可用的。参见例如Fang等人，“Fluoride-Cleavable Biotinylation Phosphoramidite for 5′-end-Labellingand Affinity Purification of Synthetic Oligonucleotides，”Nucleic AcidsRes.2003年1月15日；31(2)：708-715，其出于所有目的全文以引用方式并入本文。同样，可以使用蛋白质和肽生物素酰化技术。参见例如美国专利号6,265,552，其出于所有目的以引用方式并入本文。此外，可以使用点击反应化学来将报告寡核苷酸偶联至结合部分。可以在适当时使用可商购获得的试剂盒(诸如来自Thunderlink和Abcam的那些)来将报告寡核苷酸偶联至结合部分。在另一个实例中，结合部分间接地(例如，经由杂交)偶联至报告寡核苷酸，该报告寡核苷酸包含鉴定结合部分的条形码序列。例如，结合部分可以直接地偶联(例如，共价结合)至杂交寡核苷酸，该杂交寡核苷酸包含与报告寡核苷酸的序列杂交的序列。杂交寡核苷酸与报告寡核苷酸的杂交将结合部分偶联至报告寡核苷酸。在一些实施方案中，诸如在施加刺激时，报告寡核苷酸可从结合部分释放。例如，报告寡核苷酸可通过不稳定键(例如，化学不稳定、光不稳定、热不稳定等)附接至结合部分。

在一些实施方案中，来自生物样品的分析物(例如，多核苷酸或多肽)的多种不同物类可以随后与生物样品的一种或多种物理特性相关联。例如，分析物的多种不同物类可以与生物样品中分析物的位置相关联。这样的信息(例如，当分析物结合部分识别多肽时的蛋白质组信息)可以与其他空间信息(例如，来自生物样品的遗传信息，诸如DNA序列信息、转录组信息(例如，转录物序列)或两者)结合使用。例如，细胞的细胞表面蛋白可以与细胞的一种或多种物理特性(例如，细胞的形状、尺寸、活性或类型)相关联。所述一种或多种物理特性可以通过对细胞成像来表征。细胞可以被分析物标记剂结合，所述分析物标记剂包含结合细胞表面蛋白的分析物结合部分和鉴定该分析物结合部分的分析物结合部分条形码。样品(例如，组织样品或细胞)中的蛋白质分析结果可以与样品中的DNA和/或RNA分析相关联。

(ii)核酸分子和复合物

在一些方面，一种或多种核酸分子(例如，探针)与生物样品中的分析物的结合可以是直接的或间接的。在一些实施方案中，一种或多种核酸分子包含直接地与其相应分析物结合的初级探针。在其他实施方案中，一种或多种核酸分子包含直接或间接地与初级探针结合的一种或多种探针。标识符序列可以存在于核酸分子和包含一种或多种核酸分析物和/或一种或多种核酸探针的复合物中，所述一种或多种核酸探针直接或间接地与核酸分析物结合。核酸分子和复合物中的一种或多种标识符序列可以位于一个或多个用于结合一种或多种测序引物的引发位点的下游(5’)。一种或多种标识符序列可以与初级探针所结合的分析物相关联，并且标识符序列的测序可以使得能够鉴定分析物。

例如，单分子荧光原位杂交(smFISH)可用于通过检测细胞核酸分析物诸如mRNA来确定表达水平。在smFISH中，一组通常30-50个寡核苷酸(长度各为约20个核苷酸)可以与互补的mRNA靶标杂交。然后使用宽视场落射荧光显微法将单个转录物可视化为衍射限制斑点，并且进行量化。在一些实施方案中，smFISH探针可携带10-30个核苷酸长的突出序列(而不是直接缀合的荧光标记)，该突出序列不与mRNA靶标杂交，并且可以通过与其杂交可检测(例如，可荧光检测)地标记的探针来检测。smFISH探针中的突出序列可包括一种或多种标识符序列，例如条形码序列。因此，smFISH探针和mRNA靶标可以形成包含多种条形码序列的核酸复合物，可以使用本文公开的方法对其进行原位逐碱基测序。

在一些方面，本文公开了探针(例如，第一核酸探针和/或第二核酸探针)，其被引入到细胞中或用于以其他方式接触生物样品，诸如组织样品。探针可以包含通常可以通过Watson-Crick碱基配对与核酸杂交的多种实体中的任一种，诸如DNA、RNA、LNA、PNA等。探针通常含有能够直接或间接地与核酸(例如，靶核酸或探针)的至少一部分结合的靶向序列或杂交区。例如，本文描述的探针可能能够与特定的靶核酸(例如，mRNA或如本文所讨论的其他核酸)结合。在一些实施方案中，探针包含用于结合测序引物的一个或多个引发位点和可以使用测序引物测序的一种或多种下游标识符序列。

本文描述的任何探针都可以是线型探针。在一些实施方案中，线型探针可以是包含分析物结合序列(有时也称为靶识别序列)的探针。在一些实施方案中，线型探针可包含不与靶核酸或靶探针杂交的序列，诸如5’突出部和/或3’突出部。在一些实施方案中，序列(例如，5′突出部、3′突出部)不与靶核酸或靶探针杂交，但可彼此杂交和/或与一种或多种其他探针杂交形成杂交复合物，例如，杂交链反应(HCR)、分支DNA反应等中的那些。杂交复合物可以包含用于结合测序引物的一个或多个引发位点和可以使用测序引物测序的一种或多种下游标识符序列。

探针的分析物结合序列可以定位在探针内的任何位置。例如，与分析物结合的探针的分析物结合序列可以是探针中标识符序列(例如，条形码序列)的5’或3’。在一些实施方案中，探针的分析物结合序列可以是探针中引发位点或其部分的5’或3’。在一些实施方案中，分析物结合序列可包含与分析物的一部分大体上互补的序列。在一些实施方案中，所述部分可以是至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少92％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％互补的。探针的分析物结合序列可参考样品中存在或怀疑存在的靶分析物(例如，细胞RNA)来确定。在一些实施方案中，可以使用多于一种分析物结合序列来鉴定包含靶核酸或与靶核酸相关联的特定分析物。所述多于一种分析物结合序列可以在相同的探针中或在不同的探针中。例如，可以顺序和/或同时使用多种探针，其可以与相同的靶分析物的不同区或与不同的靶分析物结合(例如，杂交)。在一些实施方案中，第一探针以直接或间接地与第一分析物结合的第一多种探针提供。在一些实施方案中，第二探针以直接或间接地与第二分析物结合的第二多种探针提供。第一分析物和第二分析物可以相同或不同，并且可以使第一多种探针与样品接触，随后检测与第一多种探针相关联的信号，和使样品与第二多种探针接触并检测与其相关联的信号。

在一些实施方案中，标识符序列(例如，条形码序列)可以在本文提供的探针的单个突出部上(例如，在L-形核酸探针的突出部上，或在U-形探针的一个突出部上)。在其他实施方案中，条形码序列可以定位在探针的两个突出区(例如，U-形探针的5’和3’突出部两者)上。在一些实施方案中，单个探针的条形码序列与分析物相关联并唯一地鉴定分析物。在其他实施方案中，与相同的靶分析物杂交的多种探针的条形码序列的组合唯一地鉴定靶分析物。例如，第一探针以直接或间接地与第一分析物结合的第一多种探针提供。在一些方面，第一多种探针共同包含条形码序列的第一组合，并且条形码序列的第一组合鉴定第一分析物。在一些实施方案中，第二探针以直接或间接地与第二分析物结合的第二多种探针提供。在一些方面，第二多种探针共同包含条形码序列的第二组合，并且条形码序列的第二组合鉴定第二分析物。在一些实施方案中，在多种探针(例如，多种初级探针)中划分鉴定靶分析物的条形码序列可以降低对探针(例如，第一探针)的长度要求。

在一些实施方案中，标识符序列(例如，条形码序列)可以在初级探针中，例如直接地与细胞核酸分子诸如mRNA杂交的初级探针，或者在初级探针的产物(例如，RCA产物)中。在一些实施方案中，在与细胞核酸分子杂交时，初级探针可以包含3’或5’突出部。在一些实施方案中，3’或5’突出部包含一种或多种条形码序列。在一些实施方案中，在与细胞核酸分子杂交时，初级探针可以包含3’突出部和5’突出部。在一些实施方案中，3’突出部和5’突出部各自独立地包含一种或多种条形码序列。在一些实施方案中，初级探针可以是环状初级探针。在一些实施方案中，环状初级探针在探针的分析物结合序列外包含一种或多种条形码序列。在一些实施方案中，初级探针可以是可环化初级探针或探针组。在一些实施方案中，可环化初级探针或探针组在探针或探针组的分析物结合序列外包含一种或多种条形码序列。在一些实施方案中，初级探针可以包含被配置成与夹板杂交的分割杂交区。在一些实施方案中，分割杂交区包含一种或多种条形码序列。在一些实施方案中，初级探针在初级探针的分析物结合序列和分割杂交区外包含一种或多种条形码序列。

在一些实施方案中，标识符序列(例如，条形码序列)可以在直接地与细胞核酸分子诸如mRNA结合的探针中，或者在该探针的产物(例如，RCA产物)中。在一些实施方案中，探针可以是桥接探针(例如，初级探针)或其产物与另一探针或其产物的结合的中间探针。在一些实施方案中，探针可以是与初级探针或中间探针或其产物杂交但不直接或间接地与任何其他探针结合的检测探针。检测探针还可以包含用于使用本文公开的方法对检测探针中的标识符序列测序的引发位点。

在一些实施方案中，在与另一探针杂交时，中间或检测探针可以包含3’或5’突出部。在一些实施方案中，3’或5’突出部包含一种或多种条形码序列。在一些实施方案中，在与另一探针杂交时，中间或检测探针可以包含3’突出部和5’突出部。在一些实施方案中，3’突出部和5’突出部各自独立地包含一种或多种条形码序列。在一些实施方案中，中间或检测探针可以是环状探针。在一些实施方案中，环状探针在探针的靶结合序列外包含一种或多种条形码序列。在一些实施方案中，中间或检测探针可以是可环化探针或探针组。在一些实施方案中，可环化探针或探针组在探针或探针组的靶结合序列外包含一种或多种条形码序列。在一些实施方案中，中间或检测探针可以包含被配置成与夹板杂交的分割杂交区。在一些实施方案中，分割杂交区可以包含引发位点，并且可以使用夹板或其一部分作为测序引物以使用本文公开的方法对中间或检测探针中的标识符序列测序。包含分割杂交区的示例性探针包括但不限于US 2022/0049302中描述的那些，该文献全文以引用方式并入本文。在一些实施方案中，分割杂交区包含一种或多种条形码序列。在一些实施方案中，中间或检测探针在探针的靶结合序列和分割杂交区外包含一种或多种条形码序列。

在一些实施方案中，标识符序列(例如，条形码序列)可以在滚环扩增(RCA)产物分子、包含用于杂交链反应(HCR)的引发剂和放大剂的复合物、包含用于线型寡核苷酸杂交链反应(LO-HCR)的引发剂和放大剂的复合物、引物交换反应(PER)产物分子、包含用于分支DNA(bDNA)的预放大剂和放大剂的复合物、或包含任何两种或更多种前述分子和复合物的复合物中。例如，bDNA复合物或HCR复合物可以被组装在RCA产物上。参见例如US 2021/0198727，其全文以引用方式并入本文。可以在分子或复合物中每种标识符序列的3’处提供引发位点以使用SBS、SBB或任何其他逐碱基测序方法对标识符序列原位测序。

在一些实施方案中，包含标识符序列(例如，条形码序列)和用于对标识符序列测序的引发位点的分子或复合物可以使用以下方法生成：分支结构的靶向组装(例如，bDNA或使用锁核酸(LNA)的分支测定)、通过酶促滚环扩增(RCA)使多联体的程序化原位生长(例如，如US 2019/0055594中所述，该专利以引用方式并入本文)、HCR等、使用连续几轮化学连接(clampFISH)对拓扑链接的DNA结构的组装、发夹介导的多联体化(例如，如US 2020/0362398中所述，该专利以引用方式并入本文)，例如引物交换反应，诸如交换反应信号放大(SABER)或SABER与DNA-交换联用(Exchange-SABER)。在一些实施方案中，可以使用非酶促方法。

在一些实施方案中，包含标识符序列(例如，条形码序列)和引发位点的复合物包含直接或间接地(经由一种或多种寡核苷酸)与核酸分析物的序列杂交的放大器、直接或间接地靶向核酸分析物的探针或核酸分析物或探针的产物，例如，如图2中所示。在一些实施方案中，组件包括一个或多个放大器，每个放大器包括放大器重复序列。在一些方面，标记所述一个或多个放大器。在一些方面，不标记所述一个或多个放大器。关于示例性复合物，参见例如US 2020/0399689和US 2022/0064697，这些专利以引用方式完全并入本文。

在一些实施方案中，包含标识符序列(例如，条形码序列)和引发位点的复合物包含HCR复合物，例如，如图2中所示。HCR是一种基于核酸分子的杂交触发链的无酶核酸扩增，从HCR单体开始，这些单体彼此杂交形成带切口的核酸聚合物。该聚合物是HCR反应的产物，其最终被检测以指示靶分析物的存在。HCR在以下文献中有详细描述：Dirks和Pierce，2004，PNAS，101(43)，15275-15278；以及US 7,632,641和US 7,721,721(还参见US 2006/00234261；Chemeris等人，2008 Doklady Biochemistry and Biophysics，419，53-55；Niu等人，2010，46，3089-3091；Choi等人，2010，Nat.Biotechnol.28(11)，1208-1212；以及Song等人，2012，Analyst，137，1396-1401)。HCR单体通常包含发夹或其他亚稳态核酸结构。在最简单的HCR形式中，当引入“引发剂”核酸分子时，两种不同类型的稳定发夹单体(这里称为第一和第二HCR单体)经历杂交链反应事件，形成带长切口的双链DNA分子。HCR单体具有发夹结构，该发夹结构包含双链茎区、连接茎区的两条链的环区和在双链茎区的一端处的单链区。当单体处于发夹结构中时暴露(并因此可用于与另一分子例如引发剂或其他HCR单体杂交)的单链区可以被称为“立足点区”(或“输入结构域”)。第一HCR单体各自还包含与第二HCR单体的暴露的立足点区中的序列互补的序列。第一HCR单体中的这种互补性序列可以被称为“相互作用区”(或“输出结构域”)。类似地，第二HCR单体各自包含相互作用区(输出结构域)，例如与第一HCR单体的暴露的立足点区(输入结构域)互补的序列。在不存在HCR引发剂的情况下，这些相互作用区受到二级结构的保护(例如，它们不暴露)，因此发夹单体是稳定的或动力学被困的(也称为“亚稳态”)，并保持为单体(例如，防止系统快速平衡)，因为第一和第二组HCR单体不能彼此杂交。然而，一旦引入引发剂，它就能够与第一HCR单体的暴露的立足点区杂交，并侵入它，导致其打开。这将暴露第一HCR单体的相互作用区(例如，与第二HCR单体的立足点区互补的序列)，从而允许其与立足点区处的第二HCR单体杂交并侵入第二HCR单体。这种杂交和侵入进而打开第二HCR单体，暴露其相互作用区(其与第一HCR单体的立足点区互补)，并允许其与另一第一HCR单体杂交并侵入另一第一HCR单体。反应以这种方式继续，直至所有HCR单体都被耗尽(例如，所有HCR单体都并入到聚合物链中)。最终，该链反应导致形成第一和第二单体物种的交替单元的带切口的链。因此需要HCR引发剂的存在以便通过与第一HCR单体杂交并侵入第一HCR单体来触发HCR反应。第一和第二HCR单体被设计成彼此杂交并因此可以定义为彼此同源。它们还与给定的HCR引发剂序列同源。彼此相互作用(杂交)的HCR单体可以被描述为一组HCR单体、或者HCR单体或发夹系统。

HCR反应可以用超过两种种类或类型的HCR单体进行。例如，可以使用涉及三种HCR单体的系统。在这样的系统中，每个第一HCR单体可以包含与第二HCR单体的立足点区结合的相互作用区；每个第二HCR可以包含与第三HCR单体的立足点区结合的相互作用区；并且每个第三HCR单体可以包含与第一HCR单体的立足点区结合的相互作用区。然后，HCR聚合反应将如上所述进行，不同的是所得产物将是连续具有第一、第二和第三单体的重复单元的聚合物。可以使用具有更大数量的HCR单体组的对应系统。

在一些实施方案中，HCR产物(例如，单体物种的交替单元的带切口的链)可以包含多个突出部，每个突出部包含一种或多种标识符序列(例如，条形码序列)和用于对标识符序列原位测序的引发位点。因此，如本文所用，HCR不需要使用可检测地标记的HCR单体；相反，一种或多种HCR单体可以包含一种或多种标识符序列(例如，条形码序列)，并且HCR产物的检测包括对标识符序列原位测序。

在一些实施方案中，类似于使用发夹单体的HCR反应，也可以使用线型寡核苷酸杂交链反应(LO-HCR)来生成包含标识符序列(例如，条形码序列)和用于对标识符序列测序的引发位点的复合物。在一些实施方案中，本文提供了一种检测样品中的分析物的方法，所述方法包括：(i)进行线型寡核苷酸杂交链反应(LO-HCR)，其中使引发剂与至少第一物种和第二物种的多种LO-HCR单体接触以生成与靶核酸分子杂交的聚合LO-HCR产物，其中第一物种包含与引发剂互补的第一杂交区和与第二物种互补的第二杂交区，其中第一物种和第二物种是线型的单链核酸分子；其中所述引发剂以一个或多个部分提供，并且直接或间接与靶核酸分子杂交或包含在靶核酸分子中；以及(ii)检测聚合物产物，从而检测分析物。在一些实施方案中，第一物种和/或第二物种可以不包含发夹结构。在一些实施方案中，所述多种LO-HCR单体可以不包含亚稳态二级结构。在一些实施方案中，LO-HCR聚合物可以不包含分支结构。在一些实施方案中，进行线型寡核苷酸杂交链反应包括使靶核酸分子与引发剂接触以提供与靶核酸分子杂交的引发剂。用于LO-HCR的示例性方法和组合物见述于US 2021/0198723中，其全文以引用方式并入本文。

在一些实施方案中，LO-HCR中的聚合物产物可以包含多个突出部，每个突出部包含一种或多种标识符序列(例如，条形码序列)和用于对标识符序列原位测序的引发位点。因此，如本文所用，LO-HCR不需要使用可检测地标记的LO-HCR单体；相反，一种或多种LO-HCR单体可以包含一种或多种标识符序列(例如，条形码序列)，并且LO-HCR产物的检测包括对标识符序列原位测序。

在一些实施方案中，包含标识符序列(例如，条形码序列)和引发位点的分子(例如，多联体分子)通过引物交换反应(PER)生成。在各种实施方案中，在其3’末端上具有结构域的引物与催化发夹结合，并通过链置换聚合酶延伸出新结构域。在各种实施方案中，链置换聚合酶为Bst聚合酶。在各种实施方案中，催化发夹包括释放链置换聚合酶的终止子。在各种实施方案中，分支迁移置换延伸的引物，然后延伸的引物可以解离。在各种实施方案中，引物经历重复循环以形成多联体分子，参见例如US 2019/0106733(其以引用的方式并入本文)，关于示例性分子和PER反应组分。在各种实施方案中，多联体分子包含一种或多种标识符序列(例如，条形码序列)的多个拷贝和用于对标识符序列测序的引发位点。因此，代替使多种标记的寡核苷酸探针与多联体分子杂交，可以通过对标识符序列原位测序来检测多联体分子。

(iii)滚环扩增(RCA)产物

在一些实施方案中，包含标识符序列(例如，条形码序列)和引发位点的分子(例如，多联体分子)通过环状核酸分子的RCA生成，例如，如图2中所示。如第II-A节中所述，核酸分析物(例如，cDNA)可以被环化生成环状核酸分子并且RCA产物包含源自核酸分析物的标识符序列。在一些实施方案中，本文公开的任何合适的可环化探针或探针组可以例如使用核酸分析物或探针作为模板来环化，环化之前进行或不进行缺口填充。RCA产物可包含可以原位测序的条形码序列或其互补序列。

在一些方面，将本文公开的探针(例如，初级探针、中间探针、检测探针等)连接形成环状构建体(例如，环状探针)。在一些实施方案中，使用模板引物延伸然后连接来形成环状构建体。在一些实施方案中，使用分析物作为模板来生成连接的探针。在一些实施方案中，通过在待连接的末端之间提供插入物来形成环状构建体。在一些实施方案中，使用前述中的任何一种的组合来形成环状构建体。在一些实施方案中，连接为DNA模板化连接。在一些实施方案中，连接为RNA模板化连接。在一些实施方案中，提供夹板作为连接的模板。

连接反应的性质取决于所用探针的结构组分。在一些实施方案中，可以使用分析物(例如，RNA)作为模板来连接可环化探针或探针组的3’末端和5’末端。在一些实施方案中，在连接之前不填充缺口的情况下连接3’末端和5’末端。在一些实施方案中，在3′末端和5′末端的连接之前，先填充缺口。该缺口可以是1、2、3、4、5个或更多个核苷酸。在一些实施方案中，连接可包括酶促连接、化学连接、模板依赖性连接和/或非模板依赖性连接。在本文的实施方案中的任何一个中，连接可以包括使用具有RNA模板化DNA连接酶活性和/或RNA模板化RNA连接酶活性的连接酶。在一些实施方案中，酶促连接涉及连接酶(例如，RNA连接酶、DNA连接酶)的使用。连接酶包括ATP依赖性双链多核苷酸连接酶、NAD-i依赖性双链DNA或RNA连接酶和单链多核苷酸连接酶，例如在EC 6.5.1.1(ATP依赖性连接酶)、EC 6.5.1.2(NAD+依赖性连接酶)、EC 6.5.1.3(RNA连接酶)中所述的任何一种连接酶。连接酶的具体实例包括细菌连接酶(诸如大肠杆菌DNA连接酶)、Tth DNA连接酶、热球菌属(Thermococcus)物种(菌株9°N)DNA连接酶(9°N^TM DNA连接酶，New England Biolabs)、Taq DNA连接酶、Ampligase^TM(Epicentre Biotechnologies)和噬菌体连接酶(诸如T3 DNA连接酶、T4 DNA连接酶和T7 DNA连接酶)以及它们的突变体。在本文的实施方案中的任何一个中，连接可以包括使用选自小球藻病毒DNA连接酶(PBCV DNA连接酶)、T4 RNA连接酶、T4 DNA连接酶和单链DNA(ssDNA)连接酶的连接酶。在本文的实施方案中的任何一个中，连接可以包括使用PBCV-1DNA连接酶或其变体或衍生物和/或T4 RNA连接酶2(T4 Rnl2)或其变体或衍生物。在一些实施方案中，连接酶是T4 RNA连接酶。在一些实施方案中，连接酶包含splintR连接酶。在一些实施方案中，连接酶是单链DNA连接酶。在一些实施方案中，连接酶是T4 DNA连接酶。在一些实施方案中，连接酶是具有DNA夹板化DNA连接酶活性的连接酶。在一些实施方案中，连接酶是具有RNA夹板化DNA连接酶活性的连接酶。

在一些方面，使用高保真连接酶，诸如热稳定的DNA连接酶(例如，Taq DNA连接酶)。热稳定的DNA连接酶在升高的温度下有活性，允许通过在接近DNA链的解链温度的温度下温育连接来进一步区分。高保真连接可以通过连接酶活性位点的固有选择性和平衡条件的组合来实现，以降低退火错配dsDNA的发生率。

在一些实施方案中，进行去除步骤以去除未特异性杂交的分子。在一些实施方案中，进行去除步骤以去除未连接的探针。在一些实施方案中，去除步骤在连接之后和扩增之前进行。洗涤步骤可以在过程期间的任何时间点进行以去除非特异性结合的探针、未连接的探针等。在一些实施方案中，在去除步骤之后，环化探针保持与分析物特异性杂交。

在一些情况下，添加引物寡核苷酸用于扩增。在一些情况下，引物寡核苷酸与可环化探针或探针组一起添加。在一些情况下，引物寡核苷酸在可环化探针或探针组与样品接触之前或之后添加。在一些情况下，用于扩增环状核酸分子的引物寡核苷酸可包含与核酸(例如，cDNA或mRNA)互补的序列，以及与和核酸杂交的可环化探针互补的序列。在一些实施方案中，进行洗涤步骤以去除任何未结合的探针、引物等。在一些实施方案中，洗涤为严格洗涤。

用于扩增环状核酸分子的引物寡核苷酸可以包含具有3’末端的单链核酸序列，所述3’末端可以用作核酸延伸反应中的核酸聚合酶的底物。引物寡核苷酸可以包含RNA核苷酸和DNA核苷酸(例如，以随机或设计的模式)两者。引物寡核苷酸还可以包含本文所述的可以具有另外的功能的其他天然或合成核苷酸。引物寡核苷酸可以为约6个碱基至约100个碱基，诸如约25个碱基。

在一些情况下，在存在适当的dNTP前体和其他辅因子的情况下添加DNA聚合酶后，扩增引物通过模板的多个拷贝的复制而被延长。扩增步骤可以利用等温扩增或非等温扩增。在一些实施方案中，在形成杂交复合物和任何后续的环化(诸如例如挂锁探针的连接)之后，将环状核酸分子滚环扩增以生成含有环状核酸分子的序列的多个拷贝的RCA产物(例如，扩增子)。参见例如Baner等人，Nucleic Acids Research，26：5073-5078，1998；Lizardi等人，Nature Genetics 19：226，1998；Mohsen等人，Acc Chem Res.2016年11月15日；49(11)：2540-2550；Schweitzer等人，Proc.Natl Acad.Sci.USA 97：10113-119，2000；Faruqi等人，BMC Genomics 2：4，2000；Nallur等人，Nucl.Acids Res.29：e118，2001；Dean等人，Genome Res.11：1095-1099，2001；Schweitzer等人，Nature Biotech.20：359-365，2002；美国专利号6,054,274、6,291,187、6,323,009、6,344,329和6,368,801，其均以引用方式并入本文。

在一些实施方案中，滚环扩增产物使用选自以下的聚合酶产生：Phi29 DNA聚合酶、Phi29样DNA聚合酶、M2 DNA聚合酶、B103DNA聚合酶、GA-1 DNA聚合酶、phi-PRD1聚合酶、Vent DNA聚合酶、Deep Vent DNA聚合酶、Vent(外切-)DNA聚合酶、KlenTaq DNA聚合酶、DNA聚合酶I、DNA聚合酶I的Klenow片段、DNA聚合酶III、T3 DNA聚合酶、T4 DNA聚合酶、T5 DNA聚合酶、T7 DNA聚合酶、Bst聚合酶、rBST DNA聚合酶、N29 DNA聚合酶、TopoTaq DNA聚合酶、T7 RNA聚合酶、SP6 RNA聚合酶、T3 RNA聚合酶及其变体或衍生物。在一些实施方案中，聚合酶是Phi29 DNA聚合酶。

在一些实施方案中，聚合酶包含经修饰的重组Phi29型聚合酶。在一些实施方案中，聚合酶包含经修饰的重组Phi29、B103、GA-1、PZA、Phi15、BS32、M2Y、Nf、G1、Cp-1、PRD1、PZE、SF5、Cp-5、Cp-7、PR4、PR5、PR722或L17聚合酶。在一些实施方案中，聚合酶包含与野生型Phi29聚合酶相比具有至少一个氨基酸取代或取代的组合的经修饰重组DNA聚合酶。示例性的聚合酶见述于美国专利号8,257,954；8,133,672；8,343,746；8,658，365；8,921,086；和9,279,155中，所有这些文献均以引用方式并入本文。在一些实施方案中，在接触样品之前，不将聚合酶直接或间接固定至基底，诸如珠或平面基底(例如，玻璃载玻片)，但可以将样品固定在基底上。

在一些实施方案中，扩增在等于或约等于20℃与60℃之间的温度下进行。在一些实施方案中，扩增在等于或约等于30℃与40℃之间的温度下进行。在一些方面，扩增在为或约25℃与为或约50℃之间的温度(诸如为或约25℃、27℃、29℃、31℃、33℃、35℃、37℃、39℃、41℃、43℃、45℃、47℃或49℃)下进行。

在本文的实施方案中的任何一个中，RCA产物可以在生物样品中原位生成。在本文的实施方案中的任何一个中，可以使用线型RCA、分支RCA、树状RCA或它们的任何组合来生成产物。

在一些实施方案中，RCA产物包含一种或多种标识符序列或其互补序列的多个拷贝。在一些实施方案中，RCA产物包含一个或多个引发位点或其互补序列的多个拷贝。在一些方面，一种或多种标识符序列或其互补序列位于一种或多种引发序列或其互补序列的下游。

在一些方面，在扩增步骤期间，可以将经修饰的核苷酸添加到反应中，以将经修饰的核苷酸掺入扩增产物(例如，纳米球)中。经修饰的核苷酸的实例包括胺修饰的核苷酸。在所述方法的一些方面，例如，用于将所产生的扩增产物(例如，纳米球)锚定或交联到支架、细胞结构和/或其他扩增产物(例如，其他纳米球)上。在一些方面，扩增产物包含经修饰的核苷酸，诸如胺修饰的核苷酸。在一些实施方案中，胺修饰的核苷酸与丙烯酸N-羟基琥珀酰亚胺部分反应。其他胺修饰的核苷酸的实例包括但不限于5-氨基烯丙基-dUTP部分修饰、5-炔丙基氨基-dCTP部分修饰、N⁶-6-氨基己基-dATP部分修饰或7-脱氮杂-7-炔丙基氨基-dATP部分修饰。在一些实施方案中，经修饰的核苷酸包含碱基修饰，诸如叠氮化物和/或炔碱基修饰、二苄基环辛基(DBCO)修饰、乙烯基修饰、反式-环辛烯(TCO)等。

在一些实施方案中，引物延伸反应混合物可以包含脱氧核苷三磷酸(dNTP)或其衍生物、变体或类似物。在一些实施方案中，引物延伸反应混合物可以包含聚合酶的催化辅因子。在前述实施方案中的任一个中，引物延伸反应混合物可以包含催化二价阳离子，诸如Mg²⁺和/或Mn²⁺。

在一些方面，可以将扩增产物(例如，RCA产物)锚定到聚合物基质上。扩增产物可以固定在基质内，通常在核酸被扩增的位置，从而产生扩增子的局部集落。扩增产物可以通过空间因素固定在基质内。扩增产物也可以通过共价键或非共价键固定在基质内。以这种方式，可以认为扩增产物连接到基质上。通过固定到基质上，诸如通过共价键或交联，保持了原始扩增子的尺寸和空间关系。通过固定到基质上，诸如通过共价键或交联，扩增产物对机械应力下移动或散开有抗性。

在一些方面，扩增产物(例如，RCA产物)共聚合和/或共价附接到周围的基质上，从而保留了它们的空间关系和任何其固有的信息。在一些实施方案中，RCA产物由包埋在基质中的细胞内的DNA或RNA生成。在一些实施方案中，RCA产物也可以被官能化以形成与基质的共价附接，保留它们在细胞内的空间信息，从而提供亚细胞定位分布模式。在一些实施方案中，所提供的方法涉及在水凝胶亚单位的存在下包埋RCA产物，以形成一种或多种水凝胶包埋的扩增产物。在一些实施方案中，所描述的水凝胶-组织化学包括将核酸共价附接到原位合成的水凝胶上以进行组织清除、酶扩散和多循环测序或探针杂交，而现有的水凝胶-组织化学方法不能。在一些实施方案中，为了使扩增产物能够包埋在组织-水凝胶设置中，将胺修饰的核苷酸包含在扩增步骤(例如，RCA)中，使用丙烯酸N-羟基琥珀酰亚胺酯官能化为丙烯酰胺部分，并且与丙烯酰胺单体共聚合以形成水凝胶。

III.标识符序列的原位测序

在一些实施方案中，本文提供了一种分析细胞或组织样品的方法，所述方法包括使样品与直接或间接地与样品中某一位置处的分析物结合的探针接触，其中所述探针或其产物(例如，扩增产物，诸如RCA产物)包含引发位点和存在于分析物中、与分析物相关联、对应于分析物和/或鉴定分析物的标识符序列。在一些实施方案中，方法还包括使样品与测序引物接触，所述测序引物被配置成与引发位点杂交并且被聚合酶和核苷酸结合，以对探针或其产物中的标识符序列或其一部分进行逐碱基测序。

在一些实施方案中，方法包括使生物样品与核苷酸在连续循环(例如，对于每个循环，核苷酸混合物包括包含不同碱基的核苷酸)中接触，其中在每个循环中形成复合物并且所述复合物包含：i)与探针或其产物杂交的测序引物或其延伸产物，ii)聚合酶，和iii)与标识符序列中的核苷酸碱基配对的同源核苷酸。在一些实施方案中，在每个循环中，方法包括检测该位置处与同源核苷酸相关联的信号(ON信号)和/或信号缺失(OFF信号)和/或检测聚合酶，其中ON信号、OFF信号或其组合对应于同源核苷酸和标识符序列中的相应核苷酸中的碱基。在一些实施方案中，方法包括生成信号代码序列，所述信号代码序列包含对应于连续循环中在该位置处的ON信号、OFF信号或其组合的信号代码，从而检测生物样品中该位置处的标识符序列。由于标识符序列可以存在于分析物中、与分析物相关联、对应于分析物和/或鉴定分析物，故检测该位置处的标识符序列可以用于鉴定该位置处的分析物。例如，在标识符序列从多种分析物中唯一地鉴定某分析物的情况下，检测该位置处的标识符序列将鉴定该位置处的该分析物。在一些实施方案中，分析物中和/或探针或其产物中的标识符序列的组合鉴定分析物，并且可以对每种标识符序列测序以解码该组合并鉴定分析物。

本公开提供了用于在细胞样品或组织样品中原位检测多种分析物的方法。本文提供了设计成减少生物样品中信号的光学拥挤的探针(例如，第一探针和第二探针)。在一些实施方案中，使第一探针和第二探针与生物样品中的第一分析物和第二分析物(例如，核酸分子，诸如mRNA)接触(图1(101))。在一些实施方案中，第一探针和第二探针直接或间接地分别与样品中第一位置和第二位置处的第一分析物和第二分析物结合。在一些方面，第一探针和第二探针为直接地与样品中的位置处的其相应分析物结合的初级探针。在一些方面，第一探针和第二探针直接或间接地与样品中的第一初级探针和第二初级探针结合。在一些实施方案中，第一探针和第二探针可以是可环化探针或探针组。在一些实施方案中，第一探针和第二探针可以是线型探针或探针组。在一些实施方案中，将第一探针和第二探针原位扩增以生成第一探针和第二探针的第一产物和第二产物(例如，第一和第二滚环扩增(RCA产物))。在一些实施方案中，第一探针和第二探针或其产物各自包含i)测序引物的引发位点和ii)与样品中的相应分析物相关联的标识符序列。例如，第一探针或其产物可包含i)第一测序引物的第一引发位点和ii)与例如在样品中的第一位置处的第一分析物相关联的第一标识符序列。测序引物的引发位点为用于开始测序反应的位点，诸如边合成边测序(SBS)或边结合边测序(SBB)反应。在一些实施方案中，第一标识符序列和第二标识符序列与样品中的第一分析物和第二分析物相关联。第一标识符序列和第二标识符序列的解码可以使得能够鉴定样品中的第一分析物和第二分析物及其相应的位置。在一些实施方案中，标识符序列为与分析物相关联或对应于分析物的身份的条形码序列，并且条形码序列解码除了揭示生物样品中分析物的空间位置外，还使得能够鉴定分析物。

在一些实施方案中，方法包括对第一标识符序列和第二标识符序列进行SBS或SBB(图1(102))。在一些实施方案中，使用第一测序引物和第二测序引物进行SBS或SBB反应。第一测序引物和第二测序引物分别与第一探针和第二探针或其产物上的第一引发位点和第二引发位点结合。在一些实施方案中，方法包括进行循环系列的核苷酸掺入步骤，例如在SBS中掺入A、T、C或G。在一些实施方案中，方法包括进行循环系列的核苷酸结合步骤，例如在SBB中结合A、T、C或G。

在一些实施方案中，方法包括在测序步骤期间检测信号诸如ON信号或信号缺失诸如OFF信号(图1(103))。在一些实施方案中，方法包括检测样品中第一位置和第二位置处的第一和第二ON信号和/或OFF信号。在一些实施方案中，在特定循环中检测到的信号对应于该循环的信号代码。在一些实施方案中，信号代码对应于第一颜色的信号、第二颜色的信号、第三颜色的信号、或信号缺失。在一些方面，第一、第二和第三颜色不同。在一些方面，第一、第二和第三颜色相同。在一些方面，在一个或多个连续循环中重复SBS或SBB反应以生成一系列信号代码，每个信号代码对应于信号(ON信号)或信号缺失(OFF信号)或ON信号和/或OFF信号的组合(图1(104))。

在一些实施方案中，在样品中的不同位置(例如，第一位置和第二位置)处检测到一系列信号代码。在一些实施方案中，在特定循环中检测到的第一条形码序列中的核苷酸对应于包含ON信号的信号代码，并且在特定循环中检测到的第二条形码序列中的相应核苷酸对应于包含OFF信号的信号代码。在一些实施方案中，选择待在同一循环中检测的第一条形码序列和第二条形码序列中的一对或多对相应的核苷酸以减少在该循环中检测到的信号的光学拥挤。

在一些方面，每个系列的信号代码都包含信号代码序列。例如，在连续循环中在第一位置处检测到的系列的信号代码包含第一信号代码序列。在连续循环中在第二位置处检测到的系列的信号代码包含第二信号代码序列。在一些方面，第一信号代码序列和第二信号代码序列用于解码第一探针和第二探针或其产物上的标识符序列。在一些实施方案中，方法包括基于第一信号代码序列和第二信号代码序列检测第一标识符序列和第二标识符序列(图1(105))。在一些方面，探针或其产物上的标识符序列为条形码序列。在一些方面，探针或其产物上的条形码序列被分配给与探针结合的分析物。在一些方面，通过SBS或SBB原位险测条形码序列使得能够并行地鉴定分析物，同时减少解码的多个循环期间信号的光学拥挤。

图2绘示了探针或其产物(例如，RCA产物)上的标识符序列的边合成边测序反应的示例性图示。还示出了包含标识符序列的示例性杂交复合物。

探针或产物可以包含i)测序引物的引发位点和ii)标识符序列。在一些实施方案中，引发位点为用于杂交测序引物以开始测序的位点。在一些实施方案中，标识符序列为条形码序列。在一些实施方案中，标识符序列或条形码序列与样品中的相应分析物相关联。探针或其产物上的标识符序列或条形码序列的解码可以使得能够鉴定与探针结合的分析物。在一些实施方案中，通过使生物样品与核苷酸混合物在连续循环中接触来进行SBS反应(图2)。在一些实施方案中，在每个循环中形成复合物，所述复合物包含i)与引发位点杂交的测序引物或其延伸产物，ii)聚合酶，和iii)与标识符序列中的核苷酸碱基配对的同源核苷酸。在一些方面，测序引物与探针或其产物上的引发位点结合并随着测序反应的进行而生成延伸产物。在一些实施方案中，测序反应包括进行循环系列的核苷酸掺入步骤。同源核苷酸A、T、C或G与标识符序列中的其相应核苷酸结合并掺入到测序引物或延伸产物中。在一些实施方案中，聚合酶将同源核苷酸掺入到测序引物或延伸产物中。在一些实施方案中，与生物样品接触的核苷酸混合物包含荧光标记的和未荧光标记的核苷酸的混合物。在一些方面，核苷酸混合物包含三种荧光标记的核苷酸和一种未荧光标记的核苷酸。在一些方面，核苷酸混合物包含两种荧光标记的核苷酸和两种未荧光标记的核苷酸。例如，如图2中所示，核苷酸T、A和G用荧光部分标记，而核苷酸C未标记。在一些实施方案中，在生物样品中的特定位置处检测与同源核苷酸相关联的信号(ON信号)和/或信号缺失(OFF信号)。在一些实施方案中，ON信号、OFF信号或其组合对应于同源核苷酸和标识符序列中的相应核苷酸中的碱基。例如，可由于标记的核苷酸T、A或G掺入到测序引物或延伸产物中而检测到ON信号，而可由于未标记的核苷酸C掺入到测序引物或延伸产物中而检测到OFF信号。在一些方面，基于由SBS生成的信号代码序列来检测标识符序列。在一些方面，如图2中所示的标识符序列检测使得能够鉴定分析物，同时减少信号的光学拥挤。

A.暗碱基和核苷酸混合物

在一些实施方案中，本文提供了一种方法，其包括在细胞或组织样品中原位确定标识符序列的序列，其中所述标识符序列包含在相应的逐碱基测序循环中不产生可检测信号的碱基，例如，这些碱基是“暗的”。在任何特定的标识符序列中，暗碱基可以是相同的(例如，全部为G)或不同的(第一个暗碱基为G，第二个暗碱基为C)。在任何特定的标识符序列中，任何两个或更多个暗碱基可以是连续的(核苷酸残基通过磷酸二酯键直接连接)或非连续的(例如，核苷酸残基由一个或多个核苷酸残基分开，所述一个或多个核苷酸残基中的至少一个包含非暗碱基)。

在一些实施方案中，使用逐碱基测序方法(例如，SBS或SBB)在细胞或组织样品中对多种不同的标识符序列原位测序，并且所述多种不同的标识符序列中的每一种包含多个暗碱基，使得许多(例如，大多数)逐碱基测序循环中的光学拥挤得到限制以促进准确且高效的信号检测和解码。

在一些实施方案中，本文提供了一种分析生物样品的方法，所述方法包括：a)使生物样品与第一探针和第二探针接触，其中：生物样品为细胞或组织样品，生物样品分别在生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，第一探针和第二探针分别直接或间接地与第一分析物和第二分析物结合，第一探针或其产物包含i)第一测序引物的第一引发位点和ii)与第一分析物相关联的第一标识符序列，并且第二探针或其产物包含i)第二测序引物的第二引发位点和ii)与第二分析物相关联的第二标识符序列；b)使用第一测序引物和第二测序引物进行第一标识符序列和第二标识符序列的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含各自对应于在连续循环中分别在第一位置和第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的信号代码，其中在连续循环中的一个或多个中，在第一位置处检测到ON信号并且在第二位置处检测到OFF信号；和c)基于第一信号代码序列和第二信号代码序列检测生物样品中的第一标识符序列和第二标识符序列。

在一些实施方案中，第一标识符序列和第二标识符序列不同并分别与不同的第一分析物和第二分析物相关联。在一些实施方案中，第一标识符序列和第二标识符序列不同并与相同的分析物相关联。在一些实施方案中，第一标识符序列和第二标识符序列可以包含条形码序列或其互补序列。在一些实施方案中，第一条形码序列和第二条形码序列可以分别分配给第一分析物和第二分析物。

在一些实施方案中，使用任何合适的方案将代码字(对应于物理条形码或标识符序列)分配给多种分析物中的每一种，所述方案最小化用于解码标识符序列的荧光图像中的光学拥挤。设计代码本和将代码字分配给分析物以最小化光学拥挤的方法在2022年3月8日提交的标题为“in situ Code Design Methods for Minimizing Optical Crowding”的US 63/317,842和2023年3月7日提交的标题为“in situ Code Design Methods forMinimizing Optical Crowding”的国际专利申请号PCT/US2023/063866中有描述，它们的内容全文以引用方式并入本文。在一些方面，将标识符序列(对应于代码字)分配给多种分析物中的每一种针对分析物中的每一种进行优化。在一些实施方案中，例如，基于多种分析物的表达数据进行标识符序列到多种分析物中的每一种的分配。例如，表达数据可包括已根据细胞类型聚类的全转录组、单细胞参考基因表达数据。在一些实施方案中，可以按照代码字中OFF位的数量和分析物(例如，基因)在所有细胞类型中的最高表达水平的降序依次将包含最大数量的OFF位的代码字/标识符序列分配给分析物(例如，基因)。在一些实施方案中，为基因指定代码字(对应于标识符序列)包括计算通过将任何仍然可用的代码字分配给当前基因而将取得的度量指标(例如，最坏情况密度或最大预测密度)。然后，将产生最低最坏情况密度的代码字分配给特定分析物。在一些情况下，最坏情况密度为具有在该代码位中ON的基因的最高总表达密度的(细胞类型、代码位)对的表达密度。

在一些情况下，可根据设计成最小化在多个测序循环期间在一个或多个检测通道(例如，1、2、3、4或多于4个检测通道)上获取的系列图像上ON信号的最大预测密度的决策规则(例如，最小化最大值决策规则)将代码字(对应于标识符序列)分配给多种分析物。例如，在一些情况下，可根据最小化在用于对多种分析物测序的多个测序循环(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或多于20个测序循环)期间获取的系列图像中的每张图像(例如，其中在每个测序循环中一个、两个、三个、四个或多于四个检测通道中的每一个获取或接收生物样品的不同图像)检测到的ON信号(对应于靶分析物相关代码字的ON位)的最大预测密度的最小化最大值决策规则将代码本的代码字分配给多种分析物(例如，至少5、至少10、至少20、至少40、至少60、至少80、至少100、至少200、至少400、至少600、至少800、至少1,000、至少2,000、至少4,000、至少6,000、至少8,000、至少10,000、至少20,000、至少40,000、至少60,000、至少80,000、至少100,000、至少200,000、至少400,000、至少600,000、至少800,000、至少1,000,000、至少2x10⁶、至少3x10⁶、至少4x10⁶、至少5x10⁶、至少6x10⁶、至少7x10⁶、至少8x10⁶、至少9x10⁶、至少10⁷、至少10⁸、至少10⁹种或多于10⁹种分析物)。

在一些情况下，可根据将确保ON位在用于测序的多个测序循环和检测通道上或多或少地均匀分布的决策规则将代码本中的代码字分配给多种分析物。例如，在一些情况下，可根据将确保对于给定的测序循环在给定的图像中检测到的ON信号的总数量在用于对多种分析物测序的多个测序循环(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或多于20个测序循环)期间获取的系列图像中的每张图像(例如，其中在每个测序循环中一个、两个、三个、四个或多于四个检测通道中的每一个获取或接收生物样品的不同图像)检测到的ON信号的平均数量的±5％、±10％、±15％、±20％或±25％内的决策规则将代码本的代码字分配给多种分析物(例如，至少5、至少10、至少20、至少40、至少60、至少80、至少100、至少200、至少400、至少600、至少800、至少1,000、至少2,000、至少4,000、至少6,000、至少8,000、至少10,000、至少20,000、至少40,000、至少60,000、至少80,000、至少100,000、至少200,000、至少400,000、至少600,000、至少800,000、至少1,000,000、至少2x10⁶、至少3x10⁶、至少4x10⁶、至少5x10⁶、至少6x10⁶、至少7x10⁶、至少8x10⁶、至少9x10⁶、至少10⁷、至少10⁸、至少10⁹种或多于10⁹种分析物)。

在一些情况下，可根据将确保在给定图像中可见的靶分析物的数量(例如，给定图像中相应的代码字具有ON位的靶分析物的数量)在用于测序的多个测序循环和检测通道上或多或少地均匀分布的决策规则将代码本中的代码字分配给多种分析物。例如，在一些情况下，可将代码本的代码字分配给多种分析物(例如，至少5、至少10、至少20、至少40、至少60、至少80、至少100、至少200、至少400、至少600、至少800、至少1,000、至少2,000、至少4,000、至少6,000、至少8,000、至少10,000、至少20,000、至少40,000、至少60,000、至少80,000、至少100,000、至少200,000、至少400,000、至少600,000、至少800,000、至少1,000,000、至少2x10⁶、至少3x10⁶、至少4x10⁶、至少5x10⁶、至少6x10⁶、至少7x10⁶、至少8x10⁶、至少9x10⁶、至少10⁷、至少10⁸、至少10⁹种或多于10⁹种分析物)以确保对于给定的测序循环在给定的图像中可见的靶分析物(例如，相应的代码字具有ON位的靶分析物)的数量在用于对多种分析物测序的多个测序循环(例如，2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或多于20个测序循环)期间获取的系列图像中的每张图像(例如，其中在每个循环中一个、两个、三个、四个或多于四个检测通道中的每一个获取或接收生物样品的不同图像)检测到的靶分析物的平均数量的±5％、±10％、±15％、±20％或±25％内。

在一些情况下，可以使用最小化最大值决策规则(例如，设计成最小化系列图像上ON信号的最大预测密度)、平均ON信号决策规则(例如，设计成确保对于给定的测序循环在给定的图像中检测到的ON信号的总数量在每张图像检测到的ON信号的平均数量的±5％、±10％、±15％、±20％或±25％内)、平均靶数量决策规则(例如，设计成确保对于给定的测序循环在给定的图像中可见的靶分析物(例如，相应的代码字具有ON位的靶分析物)的数量在每张图像检测到的靶分析物的平均数量的±5％、±10％、±15％、±20％或±25％内)或其任何组合。

在一些情况下，可以以迭代方式实施决策规则(或决策过程)。例如，在一些情况下，可根据代码字权重(例如，给定代码字中ON位的总数量)对一种或多种代码字排序，可根据预测密度对一种或多种分析物排序，并可使用对一种或多种分析物中的每一种重复的迭代过程按最大预测密度的降序将一种或多种排序的代码字分配给一种或多种排序的分析物，所述迭代过程包括：计算剩余未分配的代码字和系列图像上的分析物的每种组合的ON信号预测密度；从剩余未分配的代码字中选择将最小化系列图像上ON信号的预测密度的代码字；和将所选择的代码字分配给分析物。在一些情况下，迭代过程还可包括审查先前分配给分析物的代码字，以及改变针对当前分析物选择的代码字以最小化先前已分配代码字的分析物在系列图像上的ON信号的预测密度。

在一些方面，优化分配给分析物的代码字是这样一种方法，其中根据基于给定生物样品中靶分析物的丰度或分布的先验知识(例如，分析物的表达数据)的决策规则将代码字分配给相应的分析物，以降低对应于高表达分析物的代码字的权重。在一些情况下，可根据基于例如聚类细胞类型中靶分析物的单细胞表达数据的决策规则将代码字分配给相应的分析物，以降低对应于高表达靶分析物的代码字的权重，其中聚类细胞类型代表存在于生物样品中的细胞类型的分布。在一些情况下，一种或多种靶分析物的表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

例如，假定单细胞表达数据(例如，单细胞基因表达数据或单细胞蛋白质表达数据)可用于感兴趣的生物样品(例如，感兴趣的组织样品)，其中表达数据已根据细胞类型簇进行聚类，每个簇具有平均基因或蛋白质表达谱，并且其中聚类的细胞类型代表存在于生物样品中的细胞类型的分布。在一些情况下，聚类的单细胞表达数据可为可能在原位实验中观察到的表达谱提供最佳先验信息，其中标记的特征的密度可能模拟表达谱。

给定代码本以及将分析物(例如，基因转录物)分配到代码本中的代码字的分配，单细胞类型表达数据可用于确定在测序过程的每个测序循环和检测通道中对每种细胞类型将观察到的标记斑点的预期密度。

在一些方面，每种基因转录物的代码字被设计成通过在多个测序循环和检测通道上分布ON特征的数量(或密度)并且包括如本文所述的信号缺失(OFF信号)来明确地避免这种情况并减少过度拥挤循环的发生率。如上面所指出，在一些情况下，可根据最小化在循环测序过程期间获取的图像中ON信号的最大预测密度的决策规则(例如，最小化最大值决策规则)选择/分配代码字。在一些情况下，可根据将确保对于给定的测序循环在图像中检测到的ON信号的总数量在每张图像检测到的ON信号的平均数量的±5％、±10％、±15％、±20％或±25％内的决策规则(例如，平均ON信号决策规则)来选择/分配代码字。在一些情况下，可根据将确保对于给定的测序循环在给定的图像中可见的靶分析物(例如，相应的代码字具有ON位的靶分析物)的数量在每张图像检测到的靶分析物的平均数量的±5％、±10％、±15％、±20％或±25％内的决策规则(例如，平均靶数量决策规则)来选择/分配代码字。在任何这些情况下，决策规则还可包括基于表达数据的分配。

在一些情况下，例如，可根据代码字权重对代码字排序，可根据聚类细胞类型上的最大表达水平对分析物排序，并可使用对分析物中的每一种重复的迭代过程按最大表达水平的降序将排序的代码字分配给排序的分析物，所述迭代过程包括：计算剩余未分配的代码字和系列图像上的分析物的每种组合的ON信号预测密度；从剩余未分配的代码字中选择将最小化系列图像上ON信号的预测密度的代码字；和将所选择的代码字分配给分析物。在一些情况下，迭代过程还可包括审查先前分配给分析物的代码字，以及改变针对当前分析物选择的代码字以最小化先前已分配代码字的分析物在系列图像上的ON信号的预测密度。

在一些情况下，例如，可根据代码字权重(即，给定代码字中ON位的总数量)对代码字排序，并且可根据待检测的分析物的相应单细胞表达数据或在样品中的预测密度对待检测的分析物排序。在一些情况下，然后可将最低排序的代码字分配给最高排序的分析物。在一些情况下，可开发一种算法来将代码字分配给例如基因转录物，其中优化分配算法以最小化光学拥挤并且将ON位的总数量或密度分布在多个测序循环和检测通道上。

在一些实施方案中，在特定循环中检测到的第一标识符序列(例如，条形码序列)中的核苷酸对应于包含ON信号的信号代码，并且在特定循环中检测到的第二标识符序列(例如，条形码序列)中的相应核苷酸对应于包含OFF信号的信号代码。在一些实施方案中，可以选择待在同一循环中检测的第一条形码序列和第二条形码序列中的一对或多对相应的核苷酸以减少在该循环中检测到的信号的光学拥挤。

在一些实施方案中，第一标识符序列和/或第二标识符序列诸如条形码序列(或其相应的代码字)可以被设计成使得其中约或至少30％的核苷酸对应于OFF信号，例如，它们是暗碱基。在一些实施方案中，第一标识符序列和/或第二标识符序列(例如，条形码序列)中约30％、40％、50％、60％、70％、80％、90％、95％或更多的核苷酸为暗碱基。

在一些方面，在逐碱基测序的每个循环中检测到的信号对应于代码字中对应于标识符序列(例如，第一标识符序列和/或第二标识符序列)的位块(例如，信号代码)。标识符序列(例如，条形码序列)可基于代码字设计和使用中的碱基-染料标记方案来分配(其中后者对于每个解码(成像)循环可以是相同的，或者对于不同的解码循环可以是不同的(例如，可在每个循环中使用不同的暗碱基(对应于OFF信号))。例如，在逐碱基测序的每个循环中检测到的信号可对应于代码字(对应于标识符序列)中的3位，或其一部分，其中3位的每个组可以映射到特定的核苷酸。条形码序列可以源自代码字设计，并且使用中的碱基/染料分配方案在每个循环中可以是相同的，或可以在每个循环中调整暗碱基的分配。表1提供了代码字(对应于标识符序列)中3位的组的实例，可以使用所提供的示例性模式将其映射到核苷酸：

表1

核苷酸	3位块	染料/信号
			A	001	蓝色染料
C	010	绿色染料
			G	100	红色染料
T	000	无染料(暗)

在一些情况下，标识符由从四个选项中抽取的3位块制成。代码本的设计可包括生成具有适当数量的ON位(例如，4、5或6个)的候选代码字(例如，标识符序列)，然后连续地鉴定新的有效代码字，这些代码字也与代码本中生成的现有代码字充分间隔开。只要代码字具有正确的3位有效块，并且具有正确数量的ON位(对应于染料/信号)，ON位就可以出现在标识符中的任何地方。在一些方面，确定每个代码字必须具有的多个“ON”循环/位，可以相应地设计代码字。例如，每个代码字使用3、4、5、6、7或8个“ON”循环/位。在一些实例中，每个代码字使用5个“ON”循环/位。在一些情况下，对代码字可能有某些约束，这些约束使得更容易鉴定“真实”特征，例如，通过要求每个代码字具有以至少一定数量的颜色点亮的“ON”位。例如，可能要求每个代码字具有以至少2、3或4种颜色点亮的“ON”位。在一些情况下，这允许信号可与往往保持单一颜色的背景荧光源区分开来。在一些情况下，条形码序列源自代码字分配方案(例如，优化代码字分配)，并使用碱基和相应的染料分配方案将某核苷酸指定为“暗”。在一些情况下，对于给定的循环，可以将某核苷酸指定为暗，或者暗核苷酸可以四处移动。

在一些情况下，代码字由从四个染料标记选项中抽取的3位块制成(例如，如表1中所示)，其中块中的每个位对应于不同的检测(颜色)通道。代码本的设计可包括生成具有适当数量的ON位(例如，2、3、4、5或6个)的候选代码字(例如，标识符序列)，然后连续地鉴定新的有效代码字，这些代码字也与代码本中生成的现有代码字充分间隔开(例如，根据编辑距离，诸如汉明距离)。只要代码字具有正确数量的3位块(或代码字位)，并且具有正确数量的ON代码字位(对应于给定的测序循环中ON信号的检测)，ON位就可以出现在代码字中的任何地方。在一些方面，可以指定多个ON代码字位，使得每个代码字必须具有指定数量的ON代码字位(对应于其中检测到ON信号的测序循环的数量)，并且可以相应地设计代码字。例如，在一些情况下，每个代码字可使用1、2、3、4、5、6、7或8个ON位。在一些实例中，每个代码字使用5个ON位。在一些情况下，对代码字设计可能有某些约束，这些约束使得更容易鉴定“真实”图像特征，例如，通过要求每个代码字包含以至少一定数量的颜色点亮的ON位。例如，可能要求每个代码字具有以至少2、3或4种颜色点亮的ON位。在一些情况下，这允许信号可与往往保持单一颜色的背景荧光源区分开来。

在一些情况下，标识符序列诸如条形码序列源自代码字分配方案(例如，通过优化代码字分配以最小化光学拥挤)，并可使用碱基和相应的染料标记方案将给定的核苷酸指定为“暗”。在一些情况下，对于给定的测序循环，可以将某核苷酸指定为暗，或对于不同的循环，指定的暗核苷酸可不同。

在一些实施方案中，可以在生物样品中检测多种不同的标识符序列(或条形码序列)，并且可以在生物样品中的一个或多个位置处检测每种不同的标识符序列。在一些实施方案中，30％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，40％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，50％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，60％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，70％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，80％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，90％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。在一些实施方案中，95％或更多的不同标识符序列可以各自包含至少25％、30％、40％、50％、60％、70％、80％、90％、95％或更多为暗碱基的核苷酸。

在一些实施方案中，信号代码可以各自对应于第一颜色的信号、第二颜色的信号、第三颜色的信号、或信号缺失(例如，对应于暗碱基)，其中第一、第二和第三颜色是不同的。暗碱基可以是A、T、C和G中的任何一种或两种。可以通过使用其中包含与暗碱基互补的碱基的同源核苷酸未被可检测地标记的核苷酸混合物来“检测”标识符序列中的暗碱基。在一些实施方案中，使生物样品与第一核苷酸混合物接触，其中包含第一碱基的核苷酸未被可检测地标记，而包含除第一碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，以及使生物样品与后续核苷酸混合物接触，其中包含后续碱基的核苷酸未被可检测地标记，而包含除后续碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记。

在一些实施方案中，可以在多个测序循环中使用相同的核苷酸混合物，例如，后续碱基可以与第一碱基相同。多个测序循环中的任何两个或更多个可以是连续的或非连续的。例如，所述两个或更多个循环可以由一个或多个循环分开，所述一个或多个循环可以或可以不使用与所述两个或更多个循环中相同的核苷酸混合物。

在一些情况下，例如，标识符序列(例如，条形码序列)中的G可以被指定为暗碱基，并且可以在两个或更多个或所有测序循环中使用包含未标记的C核苷酸的核苷酸混合物，而核苷酸混合物中包含A、T或G的核苷酸被可检测地标记。在一些方面，分配为暗碱基的核苷酸可以在不同的循环中交替。在一些情况下，将不同的核苷酸分配为暗碱基可以避免标识符序列中相同碱基的长均聚物延伸段(homopolymer runs)。例如，标识符序列中的G可以在循环1、5、9中被指定为暗碱基；标识符序列中的T可以在循环2、6、10中被指定为暗碱基；标识符序列中的C可以在循环3、7、11中被指定为暗碱基；并且标识符序列中的A可以在循环4、8、12中被指定为暗碱基。在一些方面，分配为暗碱基的两种核苷酸可以在不同的循环中交替。在一些实施方案中，通过在不同的循环中分配不同的暗碱基(例如，暗碱基在循环1、5、9中可以是G，在2、6、10中可以是T，在3、7、11中可以是C，在4、8、12中可以是A)，可以避免条形码序列中相同碱基的长均聚物延伸段。

在一些情况下，核苷酸混合物包含未标记的C核苷酸以及用三种不同颜色的荧光团标记的A、T和G核苷酸，例如，T为红色，A为蓝色，G为绿色，使得标识符序列中的A、T和C分别与红色、蓝色和绿色信号(均为ON信号)相关联，而标识符序列中的暗碱基G与OFF信号相关联。下表2B中示出了两种示例性标识符(例如，条形码)序列，并指示了使用三色化学检测到的信号(暗由“-”指示)。

表2B

在一些情况下，核苷酸混合物包含未标记的C核苷酸以及用两种不同颜色的荧光团标记的A、T和G核苷酸，例如，T为红色，A为红色和绿色(例如，每种包含A的核苷酸用红色荧光团和绿色荧光团标记)，G为绿色，使得标识符序列中的A、T和C分别与红色、红色和绿色、和绿色信号(均为ON信号)相关联，而标识符序列中的暗碱基G与OFF信号相关联。下表2A示出了使用两色化学对两种示例性条形码序列测序所检测到的信号。

表2A

在一些情况下，核苷酸混合物包含未标记的C核苷酸和用一种颜色的荧光团标记的A、T和G核苷酸。例如，每个测序循环可以包括两个化学步骤和两个成像步骤。第一化学步骤将样品暴露于具有荧光标记的A和T核苷酸的核苷酸混合物，其中混合物中的C和G核苷酸未被荧光标记，但C核苷酸包含用于向其上附接荧光标记的官能团或部分。在第一成像步骤期间，检测样品中多个位置处的信号或其缺失(图像1)。第二化学步骤从已掺入的A核苷酸去除荧光标记并向已掺入的C核苷酸添加荧光标记。在两个化学步骤中，G核苷酸均未被标记。再次检测样品中多个位置处的信号或其缺失(图像2)。处理图像1和图像2的组合以鉴定在每个位置处掺入了哪些碱基。例如，测序循环中的信号代码(图像1/图像2)对于标识符序列(例如，条形码序列)中的T可以是ON/OFF，G可以是OFF/ON，A可以是ON/ON，C可以是OFF/OFF。在一些实施方案中，在特定循环中检测到的第一条形码序列中的核苷酸对应于ON信号(例如，T为ON/OFF，G为OFF/ON，A为ON/ON)，并且在特定循环中检测到的第二条形码序列中的相应核苷酸仅对应于OFF信号(例如，C为OFF/OFF)。

在一些实施方案中，可以在多个测序循环中使用不同的核苷酸混合物。例如，第一核苷酸混合物可以包括包含未被可检测地标记的第一碱基的核苷酸，而第一核苷酸混合物中包含除所述第一碱基之外的碱基的核苷酸各自用一种或多种可检测标记(例如，一种、两种或三种不同的颜色)标记，并且后续核苷酸混合物可以包括包含未被可检测地标记的后续碱基的核苷酸，而第二核苷酸混合物中包含除所述后续碱基之外的碱基的核苷酸各自用一种或多种可检测标记(例如，一种、两种或三种不同的颜色)标记，并且所述后续碱基不同于所述第一碱基。

在一些实施方案中，本文提供了一种分析生物样品的方法，所述方法包括：a)使生物样品与直接或间接地与生物样品中某一位置处的分析物结合的探针接触，其中所述探针或其产物包含引发位点和条形码序列，并且测序引物与引发位点杂交；b)使生物样品与包括包含不同碱基的核苷酸的第一核苷酸混合物接触，其中：在第一核苷酸混合物中，包含第一碱基的核苷酸未被可检测地标记，而包含一种或多种其他碱基的核苷酸被可检测地标记，并形成复合物，该复合物包含i)与探针或其产物杂交的测序引物，ii)聚合酶，和iii)与条形码序列中的第一核苷酸碱基配对的同源核苷酸，并在所述位置处检测与同源核苷酸相关联的信号(ON信号)和/或信号缺失(OFF信号)，其中ON信号、OFF信号或其组合对应于同源核苷酸和条形码序列中的第一核苷酸中的碱基；c)使生物样品与包括包含不同碱基的核苷酸的后续核苷酸混合物接触，其中：在第二核苷酸混合物中，包含后续碱基的核苷酸未被可检测地标记，而包含一种或多种其他碱基的核苷酸被可检测地标记，所述第二碱基不同于所述第一碱基，形成复合物，该复合物包含i)与探针或其产物杂交的测序引物的延伸产物，ii)聚合酶，和iii)与条形码序列中的后续核苷酸碱基配对的同源核苷酸，并在所述位置处检测与同源核苷酸相关联的信号(ON信号)和/或信号缺失(OFF信号)，其中ON信号、OFF信号或其组合对应于同源核苷酸和条形码序列中的后续核苷酸中的碱基；和d)生成信号代码序列，所述信号代码序列包含对应于该位置处步骤b)和步骤c)中的ON信号、OFF信号或其组合的信号代码，从而检测生物样品中该位置处的条形码序列。

在一些实施方案中，可以使生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：核苷酸混合物1，其中包含G的核苷酸未被可检测地标记，而包含A、C或T的核苷酸被可检测地标记(例如，使用单色、两色或三色化学)；核苷酸混合物2，其中包含T的核苷酸未被可检测地标记，而包含A、C或G的核苷酸被可检测地标记(例如，使用单色、两色或三色化学)；核苷酸混合物3，其中包含C的核苷酸未被可检测地标记，而包含A、G或T的核苷酸被可检测地标记(例如，使用单色、两色或三色化学)；和核苷酸混合物4，其中包含A的核苷酸未被可检测地标记，而包含G、C或T的核苷酸被可检测地标记(例如，使用单色、两色或三色化学)。

在一些实施方案中，可以在两个或更多个连续的逐碱基测序循环中使用任何核苷酸混合物(例如，核苷酸混合物1至核苷酸混合物4)，之前和/或之后是使用不同的核苷酸混合物的循环。示例性的顺序可以是核苷酸混合物4-核苷酸混合物2-核苷酸混合物2-核苷酸混合物1-核苷酸混合物1-核苷酸混合物1-核苷酸混合物3。

B.针对不同标识符序列的多种测序引物

在一些实施方案中，本文提供了一种方法，其包括在细胞或组织样品中原位确定多种不同标识符序列(例如，条形码序列)的序列，其中使用第一测序引物对不同标识符序列的第一子集测序并使用第二测序引物对不同标识符序列的第二子集测序。在一些方面，使用不同的测序引物测序的标识符序列可能包含在相应的逐碱基测序循环中不产生可检测信号的碱基，例如，这些碱基是“暗的”，如第III.A节中所述。在一些实施方案中，第一测序引物和第二测序引物是不同的，例如，它们与不同的引发位点结合，并且在使用第一测序引物对不同标识符序列的第一子集测序时，不检测到与不同标识符序列的第二子集相关联的信号。同样，在使用第二测序引物对不同标识符序列的第二子集测序时，不检测到与不同标识符序列的第一子集相关联的信号。因此，可以通过跨不同标识符序列使用多种测序引物并使用每种测序引物分别检测信号来改善信号的光学拥挤。

在一些实施方案中，本文提供了一种分析生物样品的方法，所述方法包括：a)使生物样品与各自直接或间接地与生物样品中某一位置处的分析物结合的多种探针接触，其中第一探针或其产物包含第一引发位点和第一条形码序列，第二探针或其产物包含第二引发位点和第二条形码序列，并且第一引发位点和第二引发位点是不同的；b)使第一测序引物与第一引发位点杂交；c)使生物样品与核苷酸在连续循环中接触，其中在每个循环中：在第一位置处形成复合物，该复合物包含i)与第一探针或其产物杂交的第一测序引物或其延伸产物，ii)聚合酶，和iii)与第一条形码序列中的核苷酸碱基配对的同源核苷酸，并在该第一位置处检测与同源核苷酸相关联的信号(ON信号)和/或信号缺失(OFF信号)，其中ON信号、OFF信号或其组合对应于同源核苷酸和第一条形码序列中的相应核苷酸中的碱基；d)去除或阻断第一测序引物或其延伸产物；e)使第二测序引物与第二引发位点杂交；f)使生物样品与核苷酸在连续循环中接触，其中在每个循环中：在第二位置处形成复合物，该复合物包含i)与第二探针或其产物杂交的第二测序引物或其延伸产物，ii)聚合酶，和iii)与第二条形码序列中的核苷酸碱基配对的同源核苷酸，并在该第二位置处检测与同源核苷酸相关联的信号(ON信号)和/或信号缺失(OFF信号)，其中ON信号、OFF信号或其组合对应于同源核苷酸和第二条形码序列中的相应核苷酸中的碱基；g)生成第一信号代码序列和第二信号代码序列，所述第一信号代码序列包含对应于在连续循环中在第一位置处的信号的信号代码，所述第二信号代码序列包含对应于在连续循环中在第二位置处的信号的信号代码，从而检测生物样品中第一位置处的第一条形码序列和第二位置处的第二条形码序列。

在一些实施方案中，第一探针和第二探针直接或间接地与相同的分析物结合。在一些实施方案中，第一探针和第二探针直接或间接地与不同的分析物结合。在一些实施方案中，第一条形码序列和第二条形码序列具有相同的序列，但3’引发位点不同。因此，可以使用不同的测序引物对相同的条形码序列测序。在一些实施方案中，第一条形码序列和第二条形码序列不同，并使用不同的测序引物测序。第一条形码序列和第二条形码序列可以与相同的分析物或不同的分析物相关联、对应于相同的分析物或不同的分析物和/或鉴定相同的分析物或不同的分析物。在一些情况下，多种不同的探针包含相同的第一引发位点(例如，引物结合序列)，但所述多种不同的探针中的每一种包含不同的条形码序列。在一些情况下，第一多种不同的探针包含相同的第一引发位点(例如，引物结合序列)，但所述第一多种不同的探针中的每一种包含不同的条形码序列，并且第二多种不同的探针包含相同的第二引发位点(例如，引物结合序列)，但所述第二多种不同的探针中的每一种包含不同的条形码序列。

在一些实施方案中，方法可以包括使第一测序引物与第一引发位点杂交并且进行逐碱基测序(例如，SBS或SBB)以生成第一测序引物的延伸产物。如图3中所示，第一测序引物可以与包含标识符序列的第一集合(“块”)——例如，基因1至3的条形码序列(图中的基因块1)——的分子或复合物(例如，探针或其产物)中的第一引发位点杂交并用于对标识符序列的第一集合测序，而不检测与标识符序列的第二集合(“块”)——例如，基因4至6的条形码序列(图中的基因块2)——中的碱基相关联的信号。在一些实施方案中，阻止第一测序引物的延伸产物生成逐碱基测序诸如SBS和SBB的信号。在一些实施方案中，方法包括去除、切割或阻断第一测序引物的延伸产物。在一些实施方案中，方法还包括使第二测序引物与第二引发位点杂交并且进行逐碱基测序(例如，SBS或SBB)以生成第二测序引物的延伸产物。如图3中所示，第二测序引物可以与包含标识符序列的第二集合(例如，基因块2中的条形码序列)的分子或复合物(例如，探针或其产物)中的第二引发位点杂交并用于对标识符序列的第二集合测序，而不检测与标识符序列的第一集合(例如，基因块1中的条形码序列)中的碱基相关联的信号。在一些实施方案中，阻止第二测序引物的延伸产物生成逐碱基测序诸如SBS和SBB的信号。在一些实施方案中，方法包括去除、切割或阻断第二测序引物的延伸产物。

在一些实施方案中，方法还包括使第三测序引物与第三引发位点杂交并且进行逐碱基测序(例如，SBS或SBB)以生成第三测序引物的延伸产物。在一些实施方案中，第三测序引物在序列上不同于第一测序引物和第二测序引物。可以使第三测序引物与包含标识符序列的第三集合的分子或复合物(例如，探针或其产物)中的第三引发位点杂交并用于对标识符序列的第三集合测序，而不检测与标识符序列的第一集合或第二集合中的碱基相关联的信号。例如，第三测序引物可以用于对不同于图3中示出的基因1至6的基因的条形码序列测序。

在一些实施方案中，针对第一多种分析物的探针或其产物可以共享共同的第一引发位点，并且针对第二多种分析物的探针或其产物可以共享共同的第二引发位点。在一些实施方案中，第二多种分析物可以包含两种或更多种不同的分析物，这些分析物与第一多种分析物中的两种或更多种不同的分析物不同。例如，如图3中所示，针对基因块1(包含基因1至3)的探针或其产物共享共同的第一引发位点(“测序引物1”结合位点)，针对基因块2(包含基因4至6)的探针或其产物共享共同的第二引发位点(“测序引物2”结合位点)，并且基因块1中的至少一种、两种或所有基因不同于基因块2中的那些。

在一些实施方案中，第一测序引物(例如，图3中的“测序引物1”)和第二测序引物(例如，图3中的“测序引物2”)可以预先混合或单独地但同时与生物样品接触，随后进行多个解码循环。在一些实施方案中，可以选择性地阻断其中一种测序引物在逐碱基测序中生成信号，而从另一测序引物进行测序。一旦完成从其中一种测序引物进行的测序，被阻断的测序引物就可以被解除阻断并用于对标识符序列测序。

在一些实施方案中，多种标识符序列包含多个子集，并且每个子集可以使用不同的测序引物/引发位点在单独系列的测序循环中测序，从而与其中多种标识符序列中的所有标识符序列都在相同系列的测序循环中测序的方法相比减少光学拥挤。

在一些情况下，可以使用两种不同的测序引物对对应于两种分析物(例如，基因)的条形码序列测序，并且条形码序列可以在两种基因之间共享。在一些情况下，条形码序列可以重复用于不同的分析物。

C.针对相同标识符序列的测序引物组合

在一些实施方案中，可以使用两种或更多种不同的测序引物来对相同的标识符序列测序。例如，分子或复合物可以包含两个不同的引发位点，例如，如图4中所示，基因1至5的分子或复合物中的每一种可以包含两个不同的引发位点以用于对对应于分析物(例如，相应基因的转录物)的标识符序列测序。分子或复合物可以是本文公开的任何那些，例如，如图2中所示的RCA产物或探针复合物。在每种分子或复合物中，两个不同的引发位点都可以是标识符序列的3’(例如，条形码序列)，并且其中一个引发位点可以是另一个引发位点的3’或5’。在一些实施方案中，不同的引发位点可以部分地重叠。在一些实施方案中，在每种分子或复合物中，其中一个引发位点可以是标识符序列的一个拷贝的3’，而另一个引发位点可以是标识符序列的另一个拷贝的3’。在一些方面，使用不同的引发位点测序的标识符序列可包含在相应的逐碱基测序循环中不产生可检测信号的碱基，例如，这些碱基是“暗的”，如第III.A节中所述。

在一些实施方案中，可以使生物样品与各自被配置成直接或间接地与不同的分析物结合的多种探针接触，并且每种探针或其产物可以包含不同引发位点的组合。在一些实施方案中，所述组合包含两个、三个、四个、五个或更多个不同的引发位点。举例来说，图4显示，每种基因的探针或其产物包含两个不同的引发位点，例如基因1的“测序引物1”结合位点和“测序引物2”结合位点，以及基因2的“测序引物1”结合位点和“测序引物3”结合位点，等。

在一些实施方案中，第一探针或其产物可以包括包含第一引发位点的不同引发位点的第一组合。例如，可以使用如图4中所示的“测序引物1”和“测序引物2”对基因1的条形码序列测序。在一些实施方案中，第二探针或其产物可以包括包含第二引发位点的不同引发位点的第二组合。例如，可以使用如图4中所示的“测序引物1”和“测序引物3”对基因2的条形码序列测序。在一些实施方案中，可以使生物样品与直接或间接地与第三分析物结合的第三探针接触。在一些实施方案中，第三探针或其产物可以包括包含第一引发位点、第二引发位点和/或第三引发位点的不同引发位点的第三组合。在一些实施方案中，所述第一组合、第二组合和第三组合中的任何两个或更多个可以共享一个或多个共同的引发位点。例如，可以使用“测序引物1”(基因1和基因2共享)和“测序引物4”(基因1和基因2不共享)对基因3的条形码序列测序。

在一些实施方案中，方法可以包括使生物样品与第一测序引物接触以进行逐碱基测序，从而使第一测序引物与第一探针或其产物中以及一种或多种其他探针或其产物中的第一引发位点杂交，并且生成第一测序引物的延伸产物。例如，如图4中所示，“测序引物1”可以与基因1至3的探针或其产物中的引发位点杂交，并对基因1至3的标识符序列(例如，条形码序列)测序。在一些实施方案中，方法还可以包括去除、切割或阻断第一测序引物的延伸产物，从而阻止它们生成逐碱基测序(例如，使用SBS和SBB)的信号。在一些实施方案中，方法还可以包括使生物样品与第二测序引物接触以进行逐碱基测序，从而使第二测序引物与第二探针或其产物中以及一种或多种其他探针或其产物中的第二引发位点杂交，并且生成第二测序引物的延伸产物。例如，如图4中所示，“测序引物2”可以与基因1、4和5的探针或其产物中的引发位点杂交，并对这些基因的标识符序列(例如，条形码序列)测序。同样，“测序引物3”可以与基因2、4和6的探针或其产物中的引发位点杂交，并对这些基因的标识符序列(例如，条形码序列)测序。

在一些实施方案中，方法可以包括使生物样品与第一测序引物和第二测序引物接触，从而使两种测序引物都与第一探针或其产物中、第二探针或其产物中以及任选地一种或多种其他探针或其产物中的相应引发位点杂交，并且生成第一测序引物的延伸产物和第二测序引物的延伸产物。在一些实施方案中，第一测序引物和第二测序引物可以预先混合或单独地但同时与生物样品接触，随后进行多个解码循环。在一些实施方案中，第一测序引物和第二测序引物的延伸产物可以被去除(例如，剥离)、切割或阻断，或以其他方式被阻止生成逐碱基测序的信号，随后是测序引物的不同混合物(例如，第三测序引物和第四测序引物)的杂交。例如，如图4中所示，“测序引物1”和“测序引物2”可以与探针或其产物中的引发位点杂交，“测序引物1”针对基因1至3，“测序引物2”针对基因1、4和5。对于其中可以从两种测序引物进行测序的基因1的标识符序列(例如，条形码序列)，信号可以区分，例如，来自“测序引物1”的“ACG”和来自“测序引物2”的“CGA”。这可以例如在标识符序列包含由引发位点分开的多个子序列的情况下取得，例如，3’-“测序引物1”结合位点-“ACG”-“测序引物2”结合位点-“CGA”-5’。

在一些实施方案中，可以进行多个循环的核苷酸掺入或结合。在一些实施方案中，方法包括使生物样品与核苷酸在连续循环中接触，检测与每个连续循环的核苷酸掺入或结合相关联的信号，以及生成多种分析物(例如，第一多种分析物和第二多种分析物)的信号代码序列。在一些实施方案中，第一多种分析物和第二多种分析物包含一种或多种共同的分析物。在一些实施方案中，第一多种分析物和第二多种分析物不包含共同的分析物。

在一些实施方案中，使用针对相同的标识符序列的测序引物组合允许使用不同的测序引物或测序引物的不同组合在单独系列的测序循环中对标识符序列的不同部分测序，并且与其中多种标识符序列中的所有标识符序列都在相同系列的测序循环中测序的方法相比有助于减少光学拥挤。在一些实施方案中，方法不受块对角代码约束。例如，使用测序引物的组合可允许标识符序列增加的复杂性。

在一些实施方案中，本文公开的任何标识符序列或其部分可以使用相同的测序引物或一种或多种不同的测序引物、使用相同的核苷酸混合物或一种或多种不同的核苷酸混合物和/或使用相同的聚合酶或一种或多种不同的聚合酶(例如，包括具有不同标记或修饰的相同聚合酶)多次测序。

在一些实施方案中，在对标识符序列或其一部分测序之后，例如，在第N轮中，可以从模板链去除第1轮测序引物的延伸产物(或其一部分)以允许第(N+1)轮的测序引物的杂交。在一些实施方案中，第(N+1)轮测序引物和第N轮测序引物在序列上相同，使得标识符序列或其部分可以被再次测序。在一些实施方案中，在第(N+1)轮中使用与第N轮中相同的核苷酸混合物对标识符序列或其部分测序。在一些实施方案中，在第(N+1)轮和第N轮中使用不同的核苷酸混合物对标识符序列或其部分测序，例如，如第III-A节中所述。在一些实施方案中，第(N+1)轮测序引物和第N轮测序引物在序列上不同，并且第(N+1)轮和第N轮中的核苷酸混合物可以相同或不同。在一些实施方案中，第(N+1)轮引发位点和第N轮引发位点都是标识符序列的3’，并且第(N+1)轮引发位点可以是第N轮引发位点的3’或5’。在一些实施方案中，第(N+1)轮引发位点和第N轮引发位点可以部分地重叠。

IV.检测和分析

通常在边合成边测序方法中，引入可检测地标记的核苷酸的第一群体(例如，dNTP)以接触与测序引物杂交的模板核苷酸，并通过聚合酶掺入第一可检测地标记的核苷酸(例如，A、T、C或G核苷酸)以使用模板核苷酸中的互补核苷酸(第一核苷酸残基)作为模板在5’至3’方向上延伸测序引物。然后可以检测来自第一可检测地标记的核苷酸的信号。可以连续地引入核苷酸的第一群体，但为了使第二可检测地标记的核苷酸掺入到延伸的测序引物中，通常去除(例如，通过洗涤)核苷酸的第一群体中未掺入到测序引物中的核苷酸，并且将可检测地标记的核苷酸的第二群体引入到反应中。然后，通过相同或不同的聚合酶掺入第二可检测地标记的核苷酸(例如，A、T、C或G核苷酸)以使用模板核苷酸中的互补核苷酸(第二核苷酸残基)作为模板在5’至3’方向上延伸已经延伸的测序引物。因此，在一些实施方案中，进行引入和去除可检测地标记的核苷酸的循环。

在一些情况下，进行以时间顺序方式引入和去除可检测地标记的核苷酸的循环以实现生物样品中的分析物(例如，完整组织中的细胞中的靶核酸)的原位分析。在一些方面，本文提供了一种用于检测可检测地标记的核苷酸从而生成与标记的寡核苷酸相关联的信号签名的方法。在一些情况下，信号签名对应于多种分析物中的一种分析物。在一些情况下，本文描述的方法部分地基于多重生物测定和读出的发展，其中首先使样品与多种核酸探针接触，从而允许探针直接或间接地结合靶分析物，然后可以时间顺序方式光学检测(例如，通过测序)所述靶分析物。在一些方面，因为核酸探针是外源添加的并且其序列可以被控制和设计，所以这允许使用针对每种分析物优化的标识符序列(例如与对内源性分子直接测序相比)。在一些方面，本文提供了一种涉及多重生物测定和测序读出物的方法，所述方法包括以时间顺序方式光学检测标记的寡核苷酸。在一些情况下，由于分析物、探针和/或其产物的位置可以在多个测序循环中保持在样品中，故对应于分析物、探针或其产物的荧光斑点在多轮循环期间保持在原位并可以进行比对以读出与每种靶分析物相关联的信号串。可以将在某一位置处观察到的信号串(例如，每轮中的ON或OFF信号)与包含分配给多种分析物的标识符序列的代码本进行比较。

在一些实施方案中，本文公开的方法包括使用一种或多种核苷酸或其类似物，包括天然核苷酸或核苷酸类似物或经修饰的核苷酸(例如，用一种或多种可检测标记标记)。在一些实施方案中，核苷酸类似物包含含氮碱基、五碳糖和磷酸基团，其中所述核苷酸的任何组分都可以被修饰和/或替换。在一些实施方案中，本文公开的方法可包括使用一种或多种不可掺入的核苷酸。不可掺入的核苷酸可在测序方法期间的任何时间点被修饰成可掺入的。

核苷酸类似物包括但不限于α-磷酸修饰的核苷酸、α-β核苷酸类似物、β-磷酸修饰的核苷酸、β-γ核苷酸类似物、γ-磷酸修饰的核苷酸、笼状核苷酸或ddNTP。核苷酸类似物的实例在美国专利号8,071,755中有述，该专利全文以引用方式并入本文。

在一些实施方案中，本文公开的方法可包括使用将可逆地阻止引物的3′-末端处的核苷酸掺入的终止子。一种类型的可逆终止子为3′-O-阻断的可逆终止子。此处，终止子部分与核苷酸的5-碳糖的3′-OH末端的氧原子相连。例如，美国专利号7,544,794和8,034,923(这些专利的公开内容以引用方式并入)描述了3′-OH基团被替换为3′-ONH₂基团的可逆终止子dNTP。另一种类型的可逆终止子为3′-未阻断的可逆终止子，其中终止子部分与核苷酸的含氮碱基相连。例如，美国专利号8,808,989(其公开内容以引用方式并入)公开了可与本文描述的方法结合使用的碱基修饰的可逆终止子核苷酸的具体实例。类似地可与本文描述的方法结合使用的其他可逆终止子包括美国专利号7,956，171、8，071,755和9,399,798中描述的那些，这些专利以引用方式并入本文。

在一些实施方案中，本文公开的方法可包括使用具有将不可逆地阻止引物的3′-末端处的核苷酸掺入的终止子部分的核苷酸类似物。不可逆核苷酸类似物包括2′，3′-二脱氧核苷酸、ddNTP(ddGTP、ddATP、ddTTP、ddCTP)。二脱氧核苷酸缺乏对聚合酶介导的合成至关重要的dNTP的3′-OH基团。

在一些实施方案中，本文公开的方法可包括使用包含阻断部分的不可掺入的核苷酸，所述阻断部分在核酸聚合反应的掺入步骤期间抑制或阻止核苷酸与第二核苷酸(引物的3′-OH)形成共价键。阻断部分可以从核苷酸去除，从而允许核苷酸掺入。

在一些实施方案中，本文公开的方法可包括使用SBS反应中存在的1、2、3、4种或更多种核苷酸类似物。在一些实施方案中，核苷酸类似物在掺入步骤期间被替换、稀释或隔离。在一些实施方案中，用天然核苷酸替换核苷酸类似物。在一些实施方案中，核苷酸类似物在掺入步骤期间被修饰。经修饰的核苷酸类似物可以与天然核苷酸相似或相同。

在一些实施方案中，本文公开的方法可包括使用与天然核苷酸相比对聚合酶具有不同结合亲和力的核苷酸类似物。在一些实施方案中，核苷酸类似物与下一个碱基的相互作用与天然核苷酸不同。核苷酸类似物和/或不可掺入的核苷酸可与模板核酸的互补碱基碱基配对。

在一些实施方案中，可以用区分和/或可检测的标签或标记来标记一种或多种核苷酸。标签可借助于其在荧光、拉曼光谱、电荷、质量、折射率、发光、长度或任何其他可测量性质方面的差异来区分。标签可附接到核苷酸上的一个或多个不同的位置，只要充分维持与聚合酶-核酸复合物的结合的保真度以使得能够正确地鉴定模板核酸上的互补碱基即可。在一些实施方案中，标签附接到核苷酸的核碱基上。或者，标签附接到核苷酸的γ磷酸位置上。

可检测标记可以适用于小规模检测和/或适用于高通量筛选。因此，合适的可检测标记包括但不限于放射性同位素、荧光团、化学发光化合物、生物发光化合物和染料。可检测标记可以被定性地检测(例如，光学地或光谱地)，或者可以被定量。定性检测通常包括其中确认可检测标记的存在或出现的检测方法，而可量化检测通常包括具有可量化(例如，数值可报告)值诸如强度、持续时间、极化和/或其他性质的检测方法。在一些实施方案中，可检测标记与另一个部分(例如，核苷酸或核苷酸类似物)结合，并且可以包括荧光、比色或化学发光标记。

在一些实施方案中，可检测标记可以附接到另一个部分，例如，核苷酸或核苷酸类似物。在一些实施方案中，可检测标记为荧光团。例如，荧光团可以来自包括以下的组：7-AAD(7-氨基放线菌素D)、吖啶橙(+DNA)、吖啶橙(+RNA)、350、430、488、532、546、555、568、594、633、647、660、680、700、750、别藻蓝蛋白(APC)、AMCA/AMCA-X、7-氨基放线菌素D(7-AAD)、7-氨基-4-甲基香豆素、6-氨基喹啉、苯胺蓝、ANS、APC-Cy7、ATTO-TAG^TM CBQCA、ATTO-TAG^TM FQ、金胺O-福尔根、BCECF(高pH)、BFP(蓝色荧光蛋白)、BFP/GFP FRET、BOBO^TM-1/BO-PRO^TM-1、BOBO^TM-3/BO-PRO^TM-3、FL、TMR、TR-X、530/550、558/568、564/570、581/591、630/650-X、650-665-X、BTC、钙黄绿素、钙黄绿素蓝、Calcium Crimson^TM、Calcium Green-1^TM、Calcium Orange^TM、白、5-羧基荧光素(5-FAM)、5-羧基萘基荧光素、6-羧基罗丹明6G、5-羧基四甲基罗丹明(5-TAMRA)、羧基-X-罗丹明(5-ROX)、Cascade Cascade Yellow^TM、CCF2(GeneBLAzer^TM)、CFP(青色荧光蛋白)、CFP/YFP FRET、色霉素A3、Cl-NERF(低pH)、CPM、6-CR 6G、CTC甲 Cychrome(PE-Cy5)、丹酰胺、丹酰尸胺、丹酰氯、DAPI、Dapoxyl、DCFH、DHR、DiA(4-Di-16-ASP)、DiD(DilC18(5))、DIDS、Dil(DilC18(3))、DiO(DiOC18(3))、DiR(DilC18(7))、Di-4ANEPPS、Di-8ANEPPS、DM-NERF(4.5-6.5pH)、DsRed(红色荧光蛋白)、EBFP、ECFP、EGFP、醇、曙红、赤藓红、溴化乙锭、乙锭均二聚体-1(EthD-1)、氯化铕(III)、5-FAM(5-羧基荧光素)、坚牢蓝、荧光素-dT亚磷酰胺、FITC、Fluo-3、Fluo-4、Fluoro-Gold^TM(高pH)、Fluoro-Gold^TM(低pH)、Fluoro-Jade、1-43、Fura-2(高钙)、Fura-2/BCECF、Fura Red^TM(高钙)、Fura Red^TM/Fluo-3、GeneBLAzer^TM(CCF2)、GFP Red Shifted(rsGFP)、GFP野生型、GFP/BFP FRET、GFP/DsRed FRET、Hoechst33342&33258、7-羟基-4-甲基香豆素(pH 9)、1，5IAEDANS、Indo-1(高钙)、Indo-1(低钙)、吲哚二羰花青、吲哚三羰花青、JC-1、6-JOE、JOJO^TM-1/JO-PRO^TM-1、LDS 751(+DNA)、LDS751(+RNA)、LOLO^TM-1/LO-PRO^TM-1、荧光黄、LysoSensor^TM蓝(pH 5)、LysoSensor^TM绿(pH 5)、LysoSensor^TM黄/蓝(pH 4.2)、绿、红、黄、Mag-Fura-2、Mag-Indo-1、Magnesium Green^TM、Marina4-甲基伞形酮、光辉霉素、绿、橙、红、NBD(胺)、尼罗红、488、500、514、太平洋蓝、PBF1、PE(R-藻红蛋白)、PE-Cy5、PE-Cy7、PE-德克萨斯红、PerCP(多甲藻黄素叶绿素蛋白)、PerCP-Cy5.5(TruRed)、PharRed(APC-Cy7)、C-藻青蛋白、R-藻青蛋白、R-藻红蛋白(PE)、PI(碘化丙啶)、PKH26、PKH67、POPO^TM-1/PO-PRO^TM-1、POPO^TM-3/PO-PRO^TM-3、碘化丙啶(PI)、PyMPO、芘、派若宁Y、Quantam Red(PE-Cy5)、喹吖因氮芥、R670(PE-Cy5)、Red 613(PE-德克萨斯红)、红色荧光蛋白(DsRed)、试卤灵、RH 414、Rhod-2、罗丹明B、Rhodamine Green^TM、RhodamineRed^TM、罗丹明鬼笔环肽、罗丹明110、罗丹明123、5-ROX(羧基-X-罗丹明)、S65A、S65C、S65L、S65T、SBFI、SITS、(高pH)、(高pH)、 (低pH)、Sodium Green^TM、#1、#2、11、13、17、45、蓝、绿、橙、5-TAMRA(5-羧基四甲基罗丹明)、四甲基罗丹明(TRITC)、硫杂二羰花青、噻唑橙、Tri-color(PE-Cy5)、TRITC(四甲基罗丹明)、TruRed(PerCP-Cy5.5)、WW 781、X-罗丹明(XRITC)、Y66F、Y66H、Y66W、YFP(黄色荧光蛋白)、 6-FAM(荧光素)、6-FAM(NHS酯)、6-FAM(叠氮化物)、HEX、TAMRA(NHS酯)、亚基马黄、MAX、TET、TEX615、ATTO 488、ATTO 532、ATTO542、ATTO 550、ATTO 565、ATTO Rhol01、ATTO 590、ATTO 633、ATTO 647N、TYE 563、TYE665、TYE 705、700、800、800CW(NHS酯)、WellRED D4染料、WellRED D3染料、WellRED D2染料、640(NHS酯)和Dy 750(NHS酯)。

可检测标记可以是本身可直接检测的(例如，放射性同位素标记或荧光标记)，或者在酶促标记的情况下，可以是可间接检测的，例如，通过催化底物化合物或组合物的化学改变，所述底物化合物或组合物是可直接检测的。标签可以发出信号或改变递送到标签的信号，从而可以检测标签的存在或不存在。在一些情况下，偶联可经由接头进行，该接头可以是可切割的，诸如光可切割的(例如，在紫外光下可切割的)、化学可切割的(例如，经由还原剂，诸如二硫苏糖醇(DTT)、三(2-羧乙基)膦(TCEP))或酶促可切割的(例如，经由酯酶、脂肪酶、肽酶或蛋白酶)。

除了本文描述的边合成边测序方法外，在一些情况下，可使用替代的测序生物化学进行核酸测序。实例包括但不限于WO 2017/117235、美国专利号9,951,385和10,655,176中描述的“边结合边测序”(SBB)方法以及美国专利号10,768,173和10,982,280中描述的“亲合力测序”(SBA)方法，其均以引用方式并入本文。也可使用US 2020/0370113中描述的测序化学，其标题为“Polymerase-nucleotide conjugates for sequencing bytrapping”并以引用方式并入本文。

在一些实施方案中，本文的SBB方法基于进行以下的重复循环：在阻止同源核苷酸共价掺入到引物中的条件下检测在沿模板的每个位置处形成的稳定复合物(例如，包含引发的模板(锚合至样品支撑结构)、聚合酶和该位置的同源核苷酸的三元复合物)，并然后延伸引物以允许检测沿模板的下一个位置(参见例如美国专利号9,951,385和10,655,176)。在边结合边测序方法中，在引物延伸到下一个位置之前进行模板的每个位置处的核苷酸的检测。通常，该方法用于通过唯一地标记每种类型的三元复合物(即，不同类型的三元复合物在其含有的核苷酸的类型方面不同)或通过单独递送形成每种类型的三元复合物所需的试剂来区分可能存在于沿核酸模板的位置处的四种不同的核苷酸类型。在一些情况下，标记可包括例如参与三元复合物中的同源核苷酸或聚合酶的荧光标记。

在一些情况下，例如，使用边结合边测序方法对核酸分子测序的方法可包括步骤：(a)在三元复合物稳定条件下形成混合物，其中所述混合物包含引发的模板核酸、聚合酶以及模板中第一、第二和第三碱基类型的核苷酸同源物；(b)检查混合物以确定是否已形成三元复合物；(c)鉴定针对引发的模板核酸分子的下一正确的核苷酸，其中如果在步骤(b)中检测到三元复合物，则将下一正确的核苷酸鉴定为第一、第二或第三碱基类型的同源物，并且其中基于步骤(b)中三元复合物的形成的不存在，将下一正确的核苷酸推定为第四碱基类型的核苷酸同源物；(d)将下一正确的核苷酸添加到步骤(b)之后的引发的模板核酸的引物中，从而产生延伸引物；和(e)对包含延伸引物的引发的模板核酸重复步骤(a)至(d)。在一些情况下，在步骤(a)中形成的混合物可包含模板中第一碱基类型的核苷酸同源物。在一些情况下，在步骤(a)中形成的混合物可包含模板中第一碱基类型和第二碱基类型的核苷酸同源物。

“亲合力测序”(或SBA)方法依赖于由形成包含多个单独的非共价结合相互作用的复合物而产生的增加的亲合力(或“功能亲合力”)(参见例如美国专利号10，768，173和10，982，280)。亲合力测序方法基于对在荧光标记的聚合物-核苷酸缀合物、聚合酶和锚合至样品支撑结构的多种引发的靶核酸分子之间形成的多价结合复合物的检测，这允许将检测/碱基识别步骤与核苷酸掺入步骤分开。使用荧光成像来检测结合的复合物并由此确定靶核酸序列中N+1个核苷酸的身份(其中引物延伸链的长度为N个核苷酸)。

在一些情况下，例如，使用亲合力测序方法的核酸测序可包括步骤：(a)提供包含以下的组合物：(i)靶核酸序列的两个或更多个拷贝；(ii)与靶核酸序列的一个或多个区互补的两种或更多种引物核酸分子；和(iii)两种或更多种聚合酶分子；(b)使组合物与聚合物-核苷酸缀合物在足以允许在聚合物-核苷酸缀合物与(a)的组合物中的靶核酸序列的两个或更多个拷贝之间形成多价结合复合物的条件下接触，其中所述聚合物-核苷酸缀合物包含两个或更多个核苷酸部分；和(c)检测多价结合复合物(例如，通过荧光成像)，由此确定靶核酸序列中的核苷酸的身份。在成像步骤之后，将多价结合复合物破坏并洗掉，将正确的核苷酸(例如，阻断的核苷酸)掺入到引物延伸链中(例如，在先前掺入的核苷酸的解除阻断之后)，并重复该循环。

具有聚合酶活性的任何合适的酶都可以用于本文描述的测序反应中，并且示例性的聚合酶包括但不限于细菌DNA聚合酶、真核DNA聚合酶、古细菌DNA聚合酶、病毒DNA聚合酶和噬菌体DNA聚合酶。细菌DNA聚合酶包括大肠杆菌DNA聚合酶I、II和III、IV和V、大肠杆菌DNA聚合酶的Klenow片段、粪堆梭菌(Cst)DNA聚合酶、热纤梭菌(Cth)DNA聚合酶和硫磺矿硫化叶菌(Sso)DNA聚合酶。真核DNA聚合酶包括DNA聚合酶α、β、γ、δ、ε、η、ζ、λ、σ、μ和K，以及Revl聚合酶(末端脱氧胞苷转移酶)和末端脱氧核苷酸转移酶(TdT)。病毒DNA聚合酶包括T4DNA聚合酶、phi-29DNA聚合酶、GA-1、phi-29样DNA聚合酶、PZA DNA聚合酶、phi-15DNA聚合酶、Cpl DNA聚合酶、Cp7 DNA聚合酶、T7 DNA聚合酶和T4聚合酶。其他DNA聚合酶包括热稳定和/或嗜热DNA聚合酶，诸如从以下分离出的DNA聚合酶：水生栖热菌(Thermus aquaticus)(Taq)DNA聚合酶、丝状栖热菌(THermus filiformis)(Tfi)DNA聚合酶、速生热球菌(Thermococcus zilligi)(Tzi)DNA聚合酶、嗜热栖热菌(Thermmus thermophilus)(Tth)DNA聚合酶、黄栖热菌(Thermus flavusu)(Tfl)DNA聚合酶、沃氏火球菌(Pyrococcuswoesei)(Pwo)DNA聚合酶、激烈火球菌(Pyrococcus furiosus)(Pfu)DNA聚合酶和TurboPfu DNA聚合酶、海栖热球菌(Thermococcus litoralis)(Tli)DNA聚合酶、火球菌属GB-D聚合酶、海栖热袍菌(Thermotoga maritima)(Tmma)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)(Bst)DNA聚合酶、古生火球菌(Pyrococcus Kodakaraensis)(KOD)DNA聚合酶、Pfx DNA聚合酶、嗜热球菌属JDF-3(JDF-3)DNA聚合酶、蛇发女怪热球菌(THermococcus gorgonarius)(Tgo)DNA聚合酶、嗜酸热球菌(Thermococcusacidophilium)DNA聚合酶；嗜酸热硫化叶菌(Sulfolobus acidocaldarius)DNA聚合酶；嗜热球菌属go N-7 DNA聚合酶；隐蔽热网菌(Pyrodictium occultum)DNA聚合酶；沃氏甲烷球菌(Methanococcus voltae)DNA聚合酶；热自养甲烷球菌(Methanococcusthermoautotrophicum)DNA聚合酶；詹氏甲烷热球菌(Methanococcus jannaschii)DNA聚合酶；脱硫古球菌属(Desulfurococcus)菌株TOK DNA聚合酶(D.Tok Pol)；火球菌(Pyrococcus abyssi)DNA聚合酶；美未氏热火球古菌(Pyrococcus horikoshii)DNA聚合酶；海岛热球菌(Pyrococcus islandicum)DNA聚合酶；烟生热球菌(Thermococcusfumicolans)DNA聚合酶；敏捷气火菌(Aeropyrum pernix)DNA聚合酶；和异二聚体DNA聚合酶DP 1/DP2。工程化和经修饰的聚合酶也可结合所公开的技术使用。例如，可以使用极端嗜热的海洋古细菌Thermococcus species 9°N的经修饰形式(例如，来自New EnglandBioLabs Inc.(马萨诸塞州伊普斯威奇)的TherminatorTM DNA聚合酶)。还其他的可用的DNA聚合酶，包括3PDX聚合酶，在美国专利号8,703，461中有公开，其公开内容全文以引用方式并入。另外的实例包括病毒RNA聚合酶，诸如T7 RNA聚合酶、T3聚合酶、SP6聚合酶和K11聚合酶；真核RNA聚合酶，诸如RNA聚合酶I、RNA聚合酶II、RNA聚合酶III、RNA聚合酶IV和RNA聚合酶V，古细菌RNA聚合酶，来自人类免疫缺陷病毒1型的HIV-1逆转录酶(PDB 1HMV)，来自人类免疫缺陷病毒2型的HIV-2逆转录酶，来自莫洛尼鼠白血病病毒的M-MLV逆转录酶，来自禽成髓细胞瘤病毒的AMV逆转录酶，和维持真核染色体的端粒的端粒酶逆转录酶。

组织样品中的荧光检测常常会因强背景荧光的存在而受到阻碍。“自体荧光”是用于将背景荧光(其可以由多种来源(包括醛固定、细胞外基质组分、红细胞、脂褐素等)引起)与来自荧光标记的抗体或探针的期望免疫荧光区分开的通用术语。组织自体荧光可能导致难以将由于荧光抗体或探针引起的信号与一般背景区分开。在一些实施方案中，本文公开的方法利用一种或多种试剂来减少组织自发荧光，例如自发荧光消除剂(Sigma/EMDMillipore)、TrueBlack脂褐素自发荧光淬灭剂(Biotium)、MaxBlock自发荧光减少试剂盒(MaxVision Biosciences)和/或非常强烈的黑色染料(例如，苏丹黑或相当的深色发色团)。

荧光标记以及与此类荧光标记缀合的核苷酸和/或多核苷酸的实例包括在以下文献中描述的那些：例如Hoagland，Handbook of Fluorescent Probesand ResearchChemicals，第九版(Molecular Probes，Inc.，Eugene，2002)；Keller和Manak，DNA Probes，第2版(Stockton Press，New York，1993)；Eckstein，编辑，Oligonucleotides andAnalogues：A Practical Approach(IRL Press，Oxford，1991)；以及Wetmur，CriticalReviews in Biochemistry and Molecular Biology，26：227-259(1991)。在一些实施方案中，适用于所提供的实施方案的示例性技术和方法包括例如在US 4,757,141、US 5,151,507和US 5,091,519中所描述的那些。在一些实施方案中，一种或多种荧光染料用作标记的靶序列的标记，例如，如以下文献中所述：US 5,188,934(4，7-二氯荧光素染料)；US 5,366,860(光谱可分辨罗丹明染料)；US 5,847,162(4，7-二氯罗丹明染料)；US 4,318,846(醚取代的荧光素染料)；US 5,800,996(能量转移染料)；US 5,066,580(黄嘌呤染料)；和US 5,688,648(能量转移染料)。也可以用量子点进行标记，如在以下文献中所述：US 6,322,901、US 6,576,291、US 6,423，551、US 6,251,303、US 6,319,426、US 6,426,513、US 6,444,143、US 5,990,479、US 6,207,392、US 2002/0045045和US 2003/0017264。如本文所用，术语“荧光标记”包含通过一种或多种分子的荧光吸收和/或发射特性传递信息的信号传导部分。示例性荧光特性包括荧光强度、荧光寿命、发射光谱特性和能量转移。

在一些方面，使用许多不同类型的显微术中的任何一种来进行检测(包括成像)，例如共聚焦显微术、双光子显微术、光场显微术、完整组织扩张显微术和/或CLARITY^TM-优化的光片显微术(COLM)。

在一些实施方案中，使用荧光显微法来进行样品的检测和成像。在一些方面，荧光显微镜为光学显微镜，其使用荧光和磷光代替或补充反射和吸收来研究有机或无机物质的性质。在荧光显微术中，用在样品中激发荧光的波长的光照射样品。然后通过显微镜物镜对荧光成像，荧光波长通常比照射波长长。该技术中可以使用两个滤光片；照射(或激发)滤光片，其确保照射接近单色且在正确的波长下，和第二发射(或屏障)滤光片，其确保没有激发光源到达检测器。可替代地，这些功能都可以由单个二向色滤光片实现。“荧光显微镜”包括使用荧光来生成图像的任何显微镜，无论其是像落射荧光显微镜这样的更简单的装置，还是像共聚焦显微镜这样的更复杂的设计，其都使用光学切片来获得荧光图像的更好分辨率。

在一些实施方案中，使用共聚焦显微法来进行样品的检测和成像。共聚焦显微镜使用点照射和检测器前方光学共轭平面中的针孔来消除离焦信号。由于只能检测到非常靠近焦平面的荧光产生的光，故图像的光学分辨率，特别是在样品深度方向上，比宽视场显微镜要好得多。然而，由于来自样品荧光的许多光在针孔处被阻挡，故分辨率的这种提高是以信号强度的降低为代价的——因此通常需要长的曝光时间。由于一次仅照射样品中的一个点，故2D或3D成像需要在试样中以规则光栅(即，平行扫描线的矩形图案)扫描。焦平面的可实现厚度主要由所用光的波长除以物镜的数值孔径限定，但也由试样的光学性质限定。薄光学切片使得这些类型的显微镜在样品的3D成像和表面轮廓分析方面特别好。CLARITY^TM-优化的光片显微术(COLM)提供了用于大型澄清样品的快速3D成像的替代显微术。COLM询问大型免疫染色组织，允许提高采集速度并产生更高质量的生成数据。

可以采用的其他类型的显微术包括明场显微术、斜照显微术、暗场显微术、相差显微术、微分干涉差(DIC)显微术、干涉反射显微术(也称为反射干涉差或RIC)、单平面照明显微术(SPIM)、超高分辨率显微术、激光显微术、电子显微术(EM)、透射电子显微术(TEM)、扫描电子显微术(SEM)、反射电子显微术(REM)、扫描透射电子显微术(STEM)和低电压电子显微术(LVEM)、扫描探针显微术(SPM)、原子力显微术(ATM)、弹道电子发射显微术(BEEM)、化学力显微术(CFM)、导电原子力显微术(C-AFM)、电化学扫描隧道显微镜(ECSTM)、静电力显微术(EFM)、流体力显微镜(FluidFM)、力调制显微术(FMM)、特征导向扫描探针显微术(FOSPM)、开尔文探针力显微术(KPFM)、磁力显微术(MFM)、磁共振力显微术(MRFM)、近场扫描光学显微术(NSOM)(或SNOM、扫描近场光学显微术、SNOM、压电响应力显微术(PFM)、PSTM、光子扫描隧道显微术(PSTM)、PTMS、光热显微光谱/显微术(PTMS)、SCM、扫描电容显微术(SCM)、SECM、扫描电化学显微术(SECM)、SGM、扫描门显微术(SGM)、SHPM、扫描霍尔探针显微术(vHPM)、SICM、扫描离子电导显微术(SICM)、SPSM自旋偏振扫描隧道显微术(SPSM)、SSRM、扫描扩散电阻显微术(SSRM)、SThM、扫描热显微术(SThM)、STM、扫描隧道显微术(STM)、STP、扫描隧道电位法(STP)、SVM、扫描电压显微术(SVM)、同步加速器x-射线扫描隧道显微术(SXSTM)和完整组织扩张显微术(exM)。

在一些实施方案中，本文的方法包括对样品进行扩展显微镜方法和技术。扩展允许以高通量方式在空间上解析密集堆积在细胞内的单个靶标(例如，mRNA或RNA转录物)。扩展显微镜技术是本领域已知的并可以如US 2016/0116384和Chen等人，Science，347，543(2015)中所述进行，这些文献中的每一个均全文以引用方式并入本文。在一些实施方案中，方法不包括对样品进行扩展显微法。在一些实施方案中，方法不包括从样品诸如组织或细胞微环境解离细胞。在一些实施方案中，方法不包括裂解样品或其中的细胞。在一些实施方案中，方法不包括将样品或来自样品的分子包埋在外源基质中。

V.样品和样品处理

本文所公开的方法和组合物可以用于分析生物样品，该生物样品可以使用多种技术(包括但不限于活检、手术和激光捕获显微术(LCM))中的任何一种从受试者获得，并且通常包括来自受试者的细胞和/或其他生物材料。生物样品也可以从真核生物获得，诸如组织样品、患者来源的类器官(PDO)或患者来源的异种移植物(PDX)。来自生物体的生物样品可以包含一种或多种其他生物体或其组分。例如，除了哺乳动物细胞和非细胞组织组分之外，哺乳动物组织切片可以包含朊病毒、类病毒、病毒、细菌、真菌或来自其他生物体的组分。

可以从其获得生物样品的受试者可以是健康或无症状的个体、患有或怀疑患有疾病(例如，患有疾病诸如癌症的患者)或易患上疾病的个体、和/或需要疗法或怀疑需要疗法的个体。

在一些实施方案中，生物样品对应于细胞(例如，源自细胞培养物、组织样品或沉积在表面上的细胞)。在具有多个细胞的细胞样品中，单个细胞可以自然地不聚集。例如，细胞可以源自细胞的悬浮液(例如，体液，诸如血液)和/或可以是从组织或组织切片解离或解聚的细胞。生物样品中细胞的数量可以变化。一些生物样品包含大量细胞，例如血液样品，而其他生物样品包含较少或仅少量的细胞或者可能仅怀疑含有细胞，例如血浆、血清、尿液、唾液、滑液、羊水、泪液、淋巴液、液体(liquor)、脑脊液等。

在一些实施方案中，含细胞的生物样品可以包括体液或源自体液的含细胞样品，例如，全血、源自血液的样品诸如血浆或血清、血沉棕黄层、尿液、痰、泪液、淋巴液、汗液、液体、脑脊液、腹水、乳汁、粪便、支气管灌洗液、唾液、羊水、鼻分泌物、阴道分泌物、精液、伤口分泌物、细胞培养物和拭子样品，或源自前述样品的任何含细胞样品。在一些实施方案中，含细胞的生物样品可以是体液、身体分泌物或身体排泄物，例如，淋巴液、血液、血沉棕黄层、血浆或血清。在一些实施方案中，含细胞的生物样品可以是循环的体液，诸如血液或淋巴液，例如，从哺乳动物诸如人获得的外周血。

生物样品可以包括任意数量的大分子，例如，细胞大分子和细胞器(例如，线粒体和细胞核)。生物样品可以作为组织样品(诸如组织切片、活检样品、芯针活检样品、针抽吸物或细针抽吸物)获得。样品可以是流体样品，诸如血液样品、尿液样品或唾液样品。样品可以是皮肤样品、结肠样品、颊拭子、组织学样品、组织病理学样品、血浆或血清样品、肿瘤样品、活细胞、培养细胞、临床样品(例如，全血或血液衍生制品、血细胞或培养的组织或细胞，包括细胞悬浮液)。在一些实施方案中，生物样品可以包含沉积在表面上的细胞。在一些实施方案中，生物样品可以包括抗原受体分子的转录物。

生物样品可以源自本文提及的受试者或生物体的均质培养物或群体，或者可替代地源自几种不同生物体的集合，例如，在群落或生态系统中。

生物样品可以包括一个或多个患病细胞。患病细胞可能具有改变的代谢特性、基因表达、蛋白质表达和/或形态学特征。疾病的实例包括炎症性障碍、代谢性障碍、神经系统障碍和癌症。癌细胞可以源自实体瘤、血液恶性肿瘤、细胞系，或者作为循环肿瘤细胞获得。生物样品还可以包括胎儿细胞和免疫细胞。

生物样品可以包括包埋在3D基质中的分析物(例如，蛋白质、RNA和/或DNA)。在一些实施方案中，源自分析物(例如，蛋白质、RNA和/或DNA)或与分析物相关联的扩增子(例如，滚环扩增产物)可被包埋在3D基质中。在一些实施方案中，3D基质可以包含通过化学和/或以酶促方式连接(例如，通过交联)的天然分子和/或合成分子网络。在一些实施方案中，3D基质可以包含合成的聚合物。在一些实施方案中，3D基质包含水凝胶。

在一些实施方案中，本文的基底可以是不溶于水性液体的任何支持物，并且允许在所述支持物上定位生物样品、分析物、特征和/或试剂(例如，探针)。在一些实施方案中，生物样品可以附着到基底上。生物样品的附着可以是不可逆的或可逆的，这取决于样品的性质和分析方法中的后续步骤。在某些实施方案中，通过将合适的聚合物涂层应用到基底上并且使样品与所述聚合物涂层接触，可以使样品可逆地附着到基底上。然后，例如使用至少部分溶解聚合物涂层的有机溶剂，可以将样品从基底上分离。水凝胶是适合用于此目的的聚合物的实例。

在一些实施方案中，基底可以用一种或多种物质涂覆或功能化，以促进样品附着到基底上。可以用于涂覆或功能化基底的合适物质包括但不限于凝集素、聚赖氨酸、抗体和多糖。

可以执行各种步骤来为测定和/或在测定期间制备或处理生物样品。除非另有说明，否则下文所述的制备或处理步骤通常可以以任何方式和以任何顺序组合，以适当地制备或处理特定样品用于和/或进行分析。

(i)组织切片

生物样品可以从受试者获得(例如，通过手术活检、整个受试者切片)或在生长基质或培养皿上体外生长为细胞群，并且作为组织薄片或组织切片制备用于分析。生长的样品可能足够薄，无需进一步的处理步骤即可用于分析。可替代地，生长的样品和经由活检或切片获得的样品可以使用机械切割装置诸如振动切片机(vibrating blade microtome)制备成薄的组织切片。作为另一种替代方案，在一些实施方案中，薄的组织切片可以通过将生物样品的触摸印记施加到合适的基底材料上来制备。

组织切片的厚度可以是细胞最大横截面尺寸的分数(例如，小于0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2或0.1)。然而，也可以使用厚度大于最大横截面细胞尺寸的组织切片。例如，可以使用冷冻切片(cryostat section)，其可以是例如10-20μm厚。

更一般地，组织切片的厚度通常取决于用于制备切片的方法和组织的物理特性，因此可以制备和使用具有各种不同厚度的切片。例如，组织切片的厚度可以是至少0.1、0.2、0.3、0.4、0.5、0.7、1.0、1.5、2、3、4、5、6、7、8、9、10、12、13、14、15、20、30、40或50μm。如果需要或方便，也可以使用更厚的切片，例如至少70、80、90或100μm或更厚。通常，组织切片的厚度在1-100μm、1-50μm、1-30μm、1-25μm、1-20μm、1-15μm、1-10μm、2-8μm、3-7μm或4-6μm之间，但是如上文所提及，也可以分析厚度大于或小于这些范围的切片。

也可以从单个生物样品中获得多个切片。例如，可以通过使用切片刀片进行活组织检查样品的连续切片来从手术活组织检查样品获得多个组织切片。系列切片之间的空间信息可以以这种方式保存，并且可以连续分析所述切片以获得关于生物样品的三维信息。

(ii)冷冻

在一些实施方案中，可以通过在适合于维持或保存组织结构的完整性(例如，物理特性)的温度下深度冷冻来制备生物样品(例如，如上文所述的组织切片)。可以使用任何数量的合适方法将冷冻组织样品切片(例如切薄片)到基底表面上。例如，可以使用设置在适合于保持组织样品的结构完整性和样品中核酸的化学特性的温度的冷冻切片机(例如，低温恒温器)制备组织样品。这样的温度可以是例如低于-15℃、低于-20℃或低于-25℃。

(iii)固定和后固定

在一些实施方案中，可以使用已建立的方法福尔马林固定和石蜡包埋(FFPE)来制备生物样品。在一些实施方案中，可以使用福尔马林固定和石蜡包埋来制备细胞悬浮液和其他非组织样品。在固定样品并包埋在石蜡或树脂块中后，可以如上文所述对样品进行切片。在分析之前，可以通过在适当的溶剂(例如，二甲苯)中温育组织切片，然后冲洗(例如，99.5％乙醇持续2分钟，96％乙醇持续2分钟，和70％乙醇持续2分钟)，从组织切片中去除石蜡包埋材料(例如，脱蜡)。

作为上文所述的福尔马林固定的替代方案，可以将生物样品固定在多种其他固定剂中的任何一种中，以在分析之前保存样品的生物结构。例如，样品可以通过浸泡在乙醇、甲醇、丙酮、多聚甲醛(PFA)-Triton及其组合中来固定。

在一些实施方案中，丙酮固定用于新鲜冷冻的样品，其可以包括但不限于皮质组织、小鼠嗅球、人脑肿瘤、人死后脑和乳腺癌样品。当进行丙酮固定时，可以不进行预透化步骤(如下文所述)。可替代地，丙酮固定可以与透化步骤结合进行。

在一些实施方案中，本文所提供的方法包括一个或多个后固定(post-fixing)(也称为后固定(postfixation))步骤。在一些实施方案中，在使样品与本文所公开的多核苷酸(例如，一个或多个探针，诸如环状或挂锁探针)接触之后进行一个或多个后固定步骤。在一些实施方案中，在包含探针和靶的杂交复合物在样品中形成之后进行一个或多个后固定步骤。在一些实施方案中，在本文所公开的连接反应(诸如将挂锁探针环化的连接)之前进行一个或多个后固定步骤。

在一些实施方案中，在使样品与非核酸分析物诸如蛋白质分析物的结合剂或标记剂(例如，抗体或其抗原结合片段)接触之后进行一个或多个后固定步骤。标记剂可以包含核酸分子(例如，报告寡核苷酸)，其包含与标记剂对应并且因此与分析物对应(例如，唯一地鉴定)的序列。在一些实施方案中，标记剂可以包含含有一个或多个条形码序列的报告寡核苷酸。

可以使用本文公开的任何合适的固定试剂(例如，在DEPC-PBS中的3％(w/v)多聚甲醛)进行后固定步骤。

(iv)包埋

作为上文所述的石蜡包埋的替代方案，可以将生物样品包埋在多种其他包埋材料中的任何一种中，以在切片和其他处理步骤之前为样品提供结构基底。在一些情况下，可以例如在分析从样品获得的组织切片之前去除包埋材料。合适的包埋材料包括但不限于蜡、树脂(例如，甲基丙烯酸树脂)、环氧树脂和琼脂。

在一些实施方案中，可以将生物样品包埋在基质(例如，水凝胶基质)中。以这种方式包埋样品通常涉及将生物样品与水凝胶接触，使得生物样品变得被水凝胶包围。例如，可以通过使样品与合适的聚合物材料接触并且活化聚合物材料以形成水凝胶来包埋样品。在一些实施方案中，形成水凝胶使得水凝胶在生物样品中内化。

在一些实施方案中，生物样品通过形成水凝胶的聚合物材料的交联而固定在水凝胶中。交联可以通过化学和/或光化学方式进行，或者可替代地通过任何其他水凝胶形成方法进行。

水凝胶-基质的组成和对生物样品的应用通常取决于生物样品的性质和制备(例如，切片的、非切片的、固定类型)。作为一个实例，在生物样品是组织切片时，水凝胶-基质可以包括单体溶液和过硫酸铵(APS)引发剂/四甲基乙二胺(TEMED)加速剂溶液。作为另一个实例，在生物样品由细胞(例如，培养的细胞或从组织样品解离的细胞)组成时，细胞可以与单体溶液和APS/TEMED溶液一起温育。对于细胞，水凝胶-基质凝胶在隔室中形成，所述隔室包括但不限于用于培养、维持或运输细胞的设备。例如，可以用添加到隔室中的单体溶液加APS/TEMED形成水凝胶-基质至约0.1μm至约2mm的深度范围。

生物样品的水凝胶包埋的另外的方法和方面描述于例如Chen等人，Science 347(6221)：543-548,2015，其全部内容以引用方式并入本文。

(v)染色和免疫组织化学(IHC)

为了便于显现，可以使用各种染色剂和染色技术对生物样品进行染色。例如，在一些实施方案中，可以使用任何数量的染色剂和/或免疫组织化学试剂对样品进行染色。可以执行一个或多个染色步骤来制备或处理用于本文所述的测定的生物样品，或者可以在测定期间和/或之后执行。在一些实施方案中，可以使样品与一种或多种核酸染色剂、膜染色剂(例如，细胞膜或核膜)、细胞学染色剂或它们的组合接触。在一些实例中，染色可以是对蛋白质、磷脂、DNA(例如，dsDNA、ssDNA)、RNA、细胞器或细胞的隔室特异的。可以使样品与一种或多种标记的抗体(例如，对感兴趣的分析物特异的第一抗体和对第一抗体特异的标记的第二抗体)接触。在一些实施方案中，可以使用对染色样品拍摄的一个或多个图像来分割样品中的细胞。

在一些实施方案中，使用亲脂性染料进行染色。在一些实例中，用亲脂性碳菁或氨基苯乙烯染料或它们的类似物(例如，DiI、DiO、DiR、DiD)进行染色。其他细胞膜染色剂可以包括FM和RH染料或对细胞膜蛋白特异的免疫组织化学试剂。在一些实例中，染色剂可以包括但不限于吖啶橙、酸性品红、俾斯麦棕、胭脂红、考马斯蓝、甲酚紫、DAPI、曙红、溴化乙锭、酸性品红、苏木精、Hoechst染色剂、碘、甲基绿、亚甲蓝、中性红、尼罗蓝、尼罗红、四氧化锇、钌红、碘化丙锭、罗丹明(例如，罗丹明B)或番红或它们的衍生物。在一些实施方案中，可以用苏木精和曙红(H&E)对样品进行染色。

可以使用苏木精和曙红(H&E)染色技术、使用帕帕尼科拉乌染色(Papanicolaoustaining)技术、马松三色染色(Masson’s trichrome staining)技术、银染色技术、苏丹染色技术和/或使用高碘酸希夫(PAS)染色技术对样品进行染色。PAS染色通常在福尔马林或丙酮固定之后进行。在一些实施方案中，可以使用罗曼诺夫斯基染色剂(包括瑞氏染色剂(Wright’s stain)、詹纳尔氏染色剂(Jenner’s stain)、坎-格二氏染色剂(Can-Grunwaldstain)、利什曼染色剂(Leishman stain)和吉姆萨染色剂(Giemsa stain))对样品进行染色。

在一些实施方案中，可以将生物样品脱色。使生物样品脱色或褪色的方法通常取决于应用于样品的染色剂的性质。例如，在一些实施方案中，通过抗体偶联将一种或多种免疫荧光染色剂应用于样品。可以使用诸如通过用还原剂和去污剂洗涤处理来切割二硫键、离液序列高的盐处理、用抗原修复溶液处理和用酸性甘氨酸缓冲液处理等技术来去除此类染色剂。用于多重染色和脱去染色的方法描述于例如Bolognesi等人，J.Histochem.Cytochem.2017；65(8)：431-444；Lin等人，Nat Commun.2015；6：8390；Pirici等人，J.Histochem.Cytochem.2009；57：567-75；以及Glass等人，J.Histochem.Cytochem.2009；57：899-905中，每篇文献的全部内容以引用方式并入本文。

(vi)等容膨胀(Isometric Expansion)

在一些实施方案中，可以将包埋在基质(例如，水凝胶)中的生物样品等容膨胀。可以使用的等容膨胀方法包括水合，其是膨胀显微术中的一个制备步骤，如Chen等人，Science347(6221)：543-548，2015中所述。

等容膨胀可以通过将生物样品的一个或多个组分锚定到凝胶、随后是凝胶形成、蛋白水解和溶胀来进行。在一些实施方案中，可以将样品中的分析物、分析物的产物和/或与样品中的分析物缔合的探针锚定到基质(例如，水凝胶)上。生物样品的等容膨胀可以发生在将生物样品固定在基底上之前或者发生在将生物样品固定在基底上之后。在一些实施方案中，可以在使基底与本文公开的探针接触之前，从基底上去除等容膨胀的生物样品。

通常，用于进行生物样品的等容膨胀的步骤可以取决于样品的特性(例如，组织切片的厚度、固定、交联)和/或感兴趣的分析物(例如，将RNA、DNA和蛋白质锚定到凝胶上的不同条件)。

在一些实施方案中，生物样品中的蛋白质被锚定到可溶胀的凝胶(诸如聚电解质凝胶)上。抗体可以在锚定到可溶胀凝胶上之前、之后或结合锚定到可溶胀凝胶上被引导至蛋白质。生物样品中的DNA和/或RNA也可以通过合适的接头锚定到可溶胀凝胶上。这样的接头的实例包括但不限于6-((丙烯酰基)氨基)己酸(丙烯酰基-X SE)(可得自ThermoFisher，Waltham，MA)、Label-IT Amine(可得自MirusBio，Madison，WI)和Label X(例如Chen等人，Nat.Methods 13：679-684，2016中所述，其全部内容通过引用并入本文)。

样品的等容膨胀可以增加样品的后续分析的空间分辨率。空间分布中分辨率的增加可以通过比较等容膨胀的样品和尚未等容膨胀的样品来确定。

在一些实施方案中，生物样品被等容膨胀至如下尺寸：其未膨胀尺寸的至少2x、2.1x、2.2x、2.3x、2.4x、2.5x、2.6x、2.7x、2.8x、2.9x、3x、3.1x、3.2x、3.3x、3.4x、3.5x、3.6x、3.7x、3.8x、3.9x、4x、4.1x、4.2x、4.3x、4.4x、4.5x、4.6x、4.7x、4.8x或4.9x。在一些实施方案中，样品被等容膨胀至其未膨胀尺寸的至少2x且小于20x。

(vii)交联和解交联

在一些实施方案中，在原位测定之前或期间将生物样品可逆地交联。在一些方面，可以将分析物、多核苷酸和/或分析物的扩增产物(例如，扩增子)或与其结合的探针锚定到聚合物基质上。例如，聚合物基质可以是水凝胶。在一些实施方案中，多核苷酸探针和/或其扩增产物(例如，扩增子)中的一个或多个可以经修饰以含有可用作锚定位点以将多核苷酸探针和/或扩增产物附接到聚合物基质的官能团。在一些实施方案中，包含寡dT的经修饰的探针可以用于结合感兴趣的mRNA分子，随后是mRNA分子的可逆交联。

水凝胶可以包括含有网络的大分子聚合物凝胶。在网状系统中，一些聚合物链可以任选地被交联，但是交联并不总是发生。

在一些实施方案中，水凝胶可以包括水凝胶亚单位，诸如但不限于丙烯酰胺、双丙烯酰胺、聚丙烯酰胺及其衍生物、聚(乙二醇)及其衍生物(例如，PEG-丙烯酸酯(PEG-DA)、PEG-RGD)、甲基丙烯酰化明胶(GelMA)、甲基丙烯酸酯化透明质酸(MeHA)、聚脂肪族聚氨酯、聚醚聚氨酯、聚酯聚氨酯、聚乙烯共聚物、聚酰胺、聚乙烯醇、聚丙二醇、聚四亚甲基氧化物、聚乙烯吡咯烷酮、聚丙烯酰胺、聚(丙烯酸羟乙酯)和聚(甲基丙烯酸羟乙酯)、胶原、透明质酸、壳聚糖、葡聚糖、琼脂糖、明胶、藻酸盐、蛋白质聚合物、甲基纤维素等、以及它们的组合。

在一些实施方案中，水凝胶包括杂化材料，例如，水凝胶材料包括合成聚合物和天然聚合物的要素。合适的水凝胶的实例描述于例如美国专利号6,391,937、9,512,422和9,889,422以及美国专利申请公开号2017/0253918、2018/0052081和2010/0055733中，每篇文献的全部内容以引用方式并入本文。

在一些实施方案中，水凝胶可以形成基底。在一些实施方案中，基底包括水凝胶和一种或多种第二材料。在一些实施方案中，将水凝胶放置在一种或多种第二材料的顶部。例如，水凝胶可以预先形成，然后放置在一种或多种第二材料的顶部、底部或与一种或多种第二材料的任何其他构型中。在一些实施方案中，水凝胶形成发生在基底形成期间接触一种或多种第二材料之后。水凝胶形成也可以发生在位于基底上的结构(例如，孔、脊、突起和/或纹理)内。

在一些实施方案中，在向样品提供探针之前、同时或之后，发生基底上的水凝胶形成。例如，水凝胶形成可以在已经含有探针的基底上进行。

在一些实施方案中，水凝胶形成发生在生物样品内。在一些实施方案中，生物样品(例如，组织切片)被包埋在水凝胶中。在一些实施方案中，水凝胶亚单位被注入到生物样品中，并且水凝胶的聚合由外部或内部刺激引发。

在生物样品内形成水凝胶的实施方案中，可以使用官能化化学。在一些实施方案中，官能化化学包括水凝胶-组织化学(HTC)。适合于HTC的任何水凝胶-组织骨架(例如，合成的或天然的)都可以用于锚定生物大分子和调节官能化。使用HTC骨架变体的方法的非限制性实例包括CLARITY、PACT、ExM、SWITCH和ePACT。在一些实施方案中，生物样品内的水凝胶形成是永久性的。例如，生物大分子可以永久粘附到水凝胶上，允许多个回合的询问。在一些实施方案中，生物样品内的水凝胶形成是可逆的。

在一些实施方案中，在聚合之前、同时和/或之后，将另外的试剂添加到水凝胶亚单位中。例如，另外的试剂可以包括但不限于寡核苷酸(例如，探针)、片段DNA的核酸内切酶、DNA的片段化缓冲液、DNA聚合酶、用于扩增核酸并且将条形码连接到扩增片段上的dNTP。可以使用其他酶，包括但不限于RNA聚合酶、连接酶、蛋白酶K和DNA酶。另外的试剂还可以包括逆转录酶(包括具有末端转移酶活性的酶)、引物和开关寡核苷酸。在一些实施方案中，在聚合之前、同时和/或之后，将光学标记添加到水凝胶亚单位中。

在一些实施方案中，在聚合之前、同时和/或之后，将HTC试剂添加到水凝胶中。在一些实施方案中，在聚合之前、同时和/或之后，将细胞标记剂添加到水凝胶中。在一些实施方案中，在聚合之前、同时和/或之后，将细胞渗透剂添加到水凝胶中。

可以使用任何合适的方法使包埋在生物样品中的水凝胶透明化。例如，电泳组织透明化方法可以用于从水凝胶包埋的样品中去除生物大分子。在一些实施方案中，水凝胶包埋的样品在水凝胶透明化之前或之后储存在介质(例如，固定介质、甲基纤维素或其他半固体介质)中。

在一些实施方案中，本文公开的方法包括使可逆交联的生物样品解交联。解交联不需要是完全的。在一些实施方案中，可逆交联的生物样品中只有一部分交联分子被解交联并允许迁移。

(viii)组织透化和处理

在一些实施方案中，生物样品可以被透化以促进物质(诸如探针)转移到样品中。如果样品没有被充分透化，则样品中物质(诸如探针)的量可能太低而不能够进行充分的分析。相反，如果组织样品渗透性太强，则组织样品内分析物的相对空间关系可能会丧失。因此，在充分透化组织样品以获得良好的信号强度的同时仍然保持样品中分析物分布的空间分辨率之间的平衡是理想的。

通常，生物样品可以通过将样品暴露于一种或多种透化剂来进行透化。用于该目的的合适试剂包括但不限于有机溶剂(例如，丙酮、乙醇和甲醇)、交联剂(例如，多聚甲醛)、去污剂(例如，皂草苷、Triton X-100^TM或Tween-20^TM)和酶(例如，胰蛋白酶、蛋白酶)。在一些实施方案中，可以将生物样品与细胞透化剂一起温育，以促进样品的透化。用于样品透化的另外的方法描述于例如Jamur等人，Method Mol.Biol.588：63-66，2010，其全部内容以引用方式并入本文。任何合适的样品透化方法通常都可以与本文所述的样品结合使用。

在一些实施方案中，可以通过向样品中添加一种或多种裂解剂来透化生物样品。合适的裂解剂的实例包括但不限于生物活性试剂如用于裂解不同细胞类型(例如，革兰氏阳性或阴性细菌、植物、酵母、哺乳动物等)的裂解酶，如溶菌酶、无色肽酶、溶葡萄球菌素、labiase、立枯丝核菌裂解酶(kitalase)、溶壁酶和多种其他可商购获得的裂解酶。

可以另外地或可替代地将其他裂解剂添加到生物样品中以促进透化。例如，基于表面活性剂的裂解溶液可以用于裂解样品细胞。裂解溶液可包含离子表面活性剂，例如月桂酰肌氨酸钠和十二烷基硫酸钠(SDS)。更一般地，化学裂解剂可以包括但不限于有机溶剂、螯合剂、去污剂、表面活性剂和离液剂。

在一些实施方案中，可以通过非化学透化方法透化生物样品。可以使用的非化学透化方法包括但不限于物理裂解技术(诸如电穿孔)、机械透化方法(例如，使用匀浆器和研磨球进行珠磨以机械破坏样品组织结构)、声学透化(例如，超声处理)和热裂解技术(诸如加热以诱导样品的热透化)。

在分析样品之前，可以向生物样品中添加附加的试剂以执行各种功能。在一些实施方案中，可以向样品中添加DNA酶和RNA酶灭活剂或抑制剂(诸如蛋白酶K)和/或螯合剂(诸如EDTA)。例如，本文所公开的方法可以包括增加用于结合的核酸的可及性的步骤，例如，打开细胞中的DNA用于探针杂交的变性步骤。例如，蛋白酶K处理可以用于释放结合有蛋白质的DNA。

(ix)RNA或cDNA物类的选择性富集

在一些实施方案中，当RNA或cDNA是分析物时，可以选择性地富集一种或多种感兴趣的RNA或cDNA分析物物类。例如，可以通过向样品中添加一种或多种寡核苷酸来选择一种或多种感兴趣的RNA或cDNA物类。在一些实施方案中，另外的寡核苷酸是用于通过酶(例如，聚合酶)引发反应的序列。例如，可以使用与一种或多种感兴趣的RNA或cDNA具有序列互补性的一种或多种引物序列来扩增一种或多种感兴趣的RNA或cDNA，从而选择性地富集这些RNA或cDNA。

在一些方面，在分析两种或更多种分析物时，使用对每种RNA或cDNA分析物特异性(例如，与每种RNA或cDNA分析物特异性杂交)的第一探针和第二探针。例如，在本文所提供的方法的一些实施方案中，模板化连接用于检测生物样品中的基因表达。可以靶向被标记剂或结合剂(例如，抗体或其表位结合片段)结合的感兴趣的分析物(诸如蛋白质)用于分析，其中结合剂与包含鉴定结合剂的报告序列的报告寡核苷酸缀合或以其他方式缔合。探针可以与报告寡核苷酸杂交，并在模板化连接反应中连接以产生用于分析的产物。在一些实施方案中，在连接之前，可以首先使用例如Mu聚合酶、DNA聚合酶、RNA聚合酶、逆转录酶、VENT聚合酶、Taq聚合酶和/或它们的任何组合、衍生物和变体(例如，工程化突变体)来填充探针寡核苷酸之间的缺口。在一些实施方案中，所述测定还可以包括模板化连接产物的扩增(例如，通过多重PCR)。

在一些实施方案中，分析物可以通过固定在生物样品中的某一位置处来进一步富集以便原位读出。在一个非限制性实例中，分析物可包括生物样品中的某个位置特有的一个或多个片段。

可替代地，可以使用多种方法中的任何一种方法缩选(例如，去除)一种或多种RNA物类。例如，可以向样品施用探针，其选择性地与核糖体RNA(rRNA)杂交，从而减少样品中rRNA的池和浓度。另外和可替代地，双链特异性核酸酶(DSN)处理可以去除rRNA(参见例如，Archer等人，Selective and flexibledepletion of problematic sequences from RNA-seq libraries at the cDNA stage，BMC Genomics，15 401，(2014)，其全部内容以引用方式并入本文)。此外，羟基磷灰石层析可以去除丰富的物类(例如，rRNA)(参见例如，Vandemoot，V..A.，cDNA normalization by hydroxyapatite chromatography to enrichtranscriptome diversity in RNA-seq applications，Biotechniques，53(6)373-80，(2012)，其全部内容以引用方式并入本文)。

生物样品可以包含一种或多种感兴趣的分析物。提供了用于进行多重测定以分析单个生物样品中的两种或更多种不同分析物的方法。

VI.组合物、试剂盒和系统

本文提供了试剂盒，例如包含一种或多种寡核苷酸(例如，第I-V节中描述的任何寡核苷酸)和用于执行本文提供的方法的说明书。在一些实施方案中，试剂盒还包含用于执行本文提供的方法的一种或多种试剂(例如，核苷酸混合物、探针等)。在一些实施方案中，试剂盒还包含一个或多个步骤所需的一种或多种试剂，所述一个或多个步骤包括如本文所述的杂交、连接、延伸、扩增、检测和/或样品制备。在一些实施方案中，试剂盒还包含酶，诸如本文描述的连接酶和/或聚合酶。在一些实施方案中，试剂盒包含聚合酶，例如用于进行引物的延伸和掺入核苷酸的聚合酶。在一些实施方案中，试剂盒可含有用于形成功能化基质(例如，水凝胶)的试剂，诸如任何合适的功能部分。在一些实例中，还提供了用于将探针和产物(例如，RCA产物)锚合到功能化基质的缓冲剂和试剂。试剂盒的各种组分可以存在于单独的容器中，或者某些相容的组分可以预先组合到单个容器中。在一些实施方案中，试剂盒还含有使用试剂盒组分实施所提供的方法的说明书。

在一些实施方案中，试剂盒可以含有用于进行所提供的方法的一个或多个步骤所需的试剂和/或消耗品。在一些实施方案中，试剂盒含有用于固定、包埋和/或透化生物样品的试剂。在一些实施方案中，试剂盒含有试剂，诸如用于连接和/或扩增的酶和缓冲液，诸如连接酶和/或聚合酶。在一些方面，试剂盒还可以包含本文所述的任何试剂，例如洗涤缓冲液和连接缓冲液。在一些实施方案中，试剂盒含有用于检测和/或测序的试剂，诸如可检测地标记的核苷酸、聚合酶或缀合物。在一些实施方案中，试剂盒任选地含有其他组分，例如核酸引物、酶和试剂、缓冲液、核苷酸、经修饰的核苷酸、用于另外的测定的试剂。

VII.用于分析生物样品的光流体仪器

本文提供了一种具有集成光学和流体学模块的仪器(“光流体仪器”或“光流体系统”)，用于如本文所述检测生物样品(例如，一种或多种细胞或组织样品)中的靶分子(例如，核酸、蛋白质、抗体等)。在光流体仪器中，流体学模块被配置成将一种或多种试剂(例如，可检测地标记的核苷酸、聚合酶或缀合物)递送至生物样品和/或从生物样品去除用过的试剂。另外，光学模块被配置成用具有一种或多种光谱发射曲线(在一定波长范围内)的光照射生物样品，并随后在一个或多个测序循环期间捕获来自生物样品的发射光信号的一张或多张图像(例如，如第1II节中所述)。在一些实施方案中，本文公开的原位测定(例如，边合成边测序)可以使用自动化仪器或系统来进行，例如，本文公开的光流体仪器或系统。

在各种实施方案中，可实时和/或稍后处理所捕获的图像以确定生物样品中一种或多种靶分子的存在，以及与每种检测到的靶分子相关联的三维位置信息。另外，光流体仪器包括被配置成接收(和任选地固定)一种或多种生物样品的样品模块。在一些情况下，样品模块包括被配置成沿X-Y平面(例如，垂直于光学模块的物镜)移动生物样品的X-Y台。

在各种实施方案中，光流体仪器被配置成在生物样品内其自然发生的地方(即，原位)分析一种或多种靶分子(例如，第III节中描述的任何分析物)。例如，光流体仪器可以是用于分析生物样品并检测靶分子(例如，分析物)的原位分析系统，包括但不限于DNA、RNA、蛋白质、抗体和/或类似物。

光流体仪器可以用于经由逐碱基测序(例如，对标识符序列诸如条形码序列的测序)和/或其他成像或靶分子检测技术进行原位靶分子检测。也就是说，例如，光流体仪器可包括流体学模块，该流体学模块包括建立探测样品中的靶分子所需的实验条件所需的流体。此外，这样的光流体仪器还可包括被配置成接收样品的样品模块，以及包括用于照射样品(例如，激发样品内的一种或多种荧光标记的核苷酸)和/或对从样品接收的光信号成像的成像系统的光学模块。原位分析系统还可包括被配置成便于光流体仪器的操作的其他辅助模块，诸如但不限于冷却系统、运动校准系统等。

图5示出了根据各种实施方案使用光流体仪器或系统500分析生物样品510(例如，细胞或组织样品)的示例工作流程。在各种实施方案中，样品510可以是包括分子诸如DNA、RNA、蛋白质、抗体等的生物样品(例如，组织)。例如，样品510可以是切片组织，其经处理以获取其RNA用于本文(例如，在第III节中)描述的探针杂交和测序。

在各种实施方案中，可将样品510放置在光流体仪器或系统500中以分析和检测样品510中的分子。在各种实施方案中，光流体仪器或系统500可以是被配置成便于有利于靶分子检测的实验条件的系统。例如，光流体仪器或系统500可以包括流体学模块540、光学模块550、样品模块560和辅助模块570，并且这些模块可由系统控制器530操作以创建用于样品510中核酸分子的逐碱基测序的实验条件以及便于样品的成像(例如，通过光学模块550的成像系统)。在各种实施方案中，光流体仪器或系统500的各种模块可以是彼此通信的单独部件，或者它们中的至少一些可以集成在一起。

在各种实施方案中，样品模块550可以被配置成将样品510接收到光流体仪器或系统500中。例如，样品模块560可包括被配置成接收样品装置(例如，盒)的样品接口模块(SIM)，样品510可以沉积到所述样品装置上。也就是说，可通过将样品510(例如，切片组织)沉积在样品装置上、然后将样品装置插入到样品模块560的SIM中来将样品510放置在光流体仪器或系统500中。在一些情况下，样品模块560还可包括SIM安装到其上的X-Y台。X-Y台可被配置成沿光流体仪器或系统500的二维(2D)平面在垂直方向上移动安装在其上的SIM(例如，和因此插入其中的含有样品510的样品装置)。

有利于检测样品510中的分子的实验条件可取决于光流体仪器或系统500所采用的靶分子检测技术。例如，在各种实施方案中，光流体仪器或系统500可以是被配置成检测样品510中的分子(例如，通过检测使用标识符序列作为模板掺入到延伸的测序引物中的核苷酸)的系统。

在各种实施方案中，流体学模块540可包括一个或多个部件，这些部件可用于储存试剂，以及用于向和从含有样品510的样品装置输送所述试剂。例如，流体学模块540可包括被配置成储存试剂的储集器，以及被配置成在光流体仪器或系统500使用以分析和检测样品510的分子之后收集试剂(例如，和其他废物)的废物容器。此外，流体学模块540还可包括被配置成便于将试剂输送到样品装置(例如，和因此样品510)的泵、管、移液管等。例如，流体学模块540可包括泵(“试剂泵”)，其被配置成将洗涤/剥离试剂泵送到样品装置以用于洗涤/剥离样品510(例如，以及其他洗涤功能，诸如洗涤光学模块550的成像系统的物镜)。

在各种实施方案中，辅助模块570可以是光流体仪器或系统500的冷却系统，并且该冷却系统可包括被配置成将冷却剂输送到光流体仪器或系统500的各种模块以调节其温度的冷却剂承载管网络。在这样的情况下，流体学模块540可包括用于储存冷却剂的冷却剂储集器和用于生成压差的泵(例如，“冷却剂泵”)，从而迫使冷却剂从储集器经由冷却剂承载管流向光流体仪器或系统500的各种模块。在一些情况下，流体学模块540可包括返回冷却剂储集器，其可被配置成接收和储存返回的冷却剂，即，在吸收由光流体仪器或系统500的各种模块排出的热量后流回到返回冷却剂储集器中的被加热的冷却剂。在这样的情况下，流体学模块540还可包括被配置成迫使空气(例如，冷却和/或环境空气)进入到返回冷却剂储集器中以冷却其中储存的被加热的冷却剂的冷却风扇。在一些情况下，流体学模块540还可包括被配置成迫使空气直接进入到光流体仪器或系统500的部件中以冷却所述部件的冷却风扇。例如，流体学模块540可包括被配置成将冷却或环境空气引导至系统控制器530中以冷却系统控制器的冷却风扇。

如上文所讨论，光流体仪器或系统500可包括光学模块550，该光学模块包括光流体仪器或系统500的各种光学部件，诸如但不限于照相机、照明模块(例如，LED)、物镜和/或类似物。光学模块550可包括荧光成像系统，其被配置成对在可检测标记被来自光学模块550的照明模块的光激发后由样品510中掺入到延伸测序引物中的可检测地标记的核苷酸发出的荧光成像。

在一些情况下，光学模块550还可包括光学框架，照相机、照明模块和/或样品模块560的X-Y台可安装在该光学框架上。

在各种实施方案中，系统控制器530可被配置成控制光流体仪器或系统500的操作(例如，和其一个或多个模块的操作)。在一些情况下，系统控制器530可采用各种形式，包括处理器、单个计算机(或计算机系统)或彼此通信的多个计算机。在各种实施方案中，系统控制器530可与数据存储器、输入装置组、显示系统或其组合通信地联接。在一些情况下，这些部件中的一些或全部可被视为系统控制器530的一部分或以其他方式与系统控制器集成，可以是彼此通信的单独部件，或者可以集成在一起。在其他实例中，系统控制器530可以是云计算平台或可以与云计算平台通信。

在各种实施方案中，光流体仪器或系统500可分析样品510并且可生成输出590，该输出包括样品510中存在靶分子的指示。例如，关于上文讨论的其中光流体仪器或系统500采用杂交技术来检测分子的示例实施方案，光流体仪器或系统500可使样品510经历连续的测序循环，其中在同一测序循环期间，对样品成像以检测样品510中至少一些位置(例如，图3中示出的基因块1中的一种或多种基因存在的位置)处与核苷酸结合和/或掺入事件相关联的信号，以及样品中其他位置(例如，图3中示出的基因块2中的一种或多种基因存在的位置)处信号缺失(例如，信号缺失可能归因于使用了未经修饰的核苷酸作为暗碱基或不存在能够检测掺入的核苷酸的试剂)。在这样的情况下，输出590可包括每种标识符序列(例如，条形码序列)特有的光学签名(例如，代码字)，从而允许鉴定靶分子。

VIII.术语

除非另有定义，否则本文所使用的所有专门术语、符号以及其他技术和科学术语旨在具有与所要求保护的主题所属领域的普通技术人员通常理解的含义相同的含义。在一些情况下，为清楚起见和/或供及时参考，本文定义了具有通常理解的含义的术语，并且本文包括此类定义不应当被解释为代表与本领域通常理解的含义具有实质性区别。

本文中可互换使用的术语“多核苷酸”、“多核苷酸”和“核酸分子”是指任何长度的核苷酸(无论是核糖核苷酸还是脱氧核糖核苷酸)的聚合形式。因此，该术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、eDNA、DNA-RNA杂交体，或者包含嘌呤和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。多核苷酸的主链可以包含糖和磷酸基团(通常可以在RNA或DNA中发现)、或者修饰或取代的糖或磷酸基团。

如本文所用的“杂交”可以是指其中两个单链多核苷酸非共价结合形成稳定的双链多核苷酸的过程。在一个方面，所得的双链多核苷酸可以是“杂交体”或“双链体”。“杂交条件”通常包括大致小于1M的盐浓度，通常小于约500mM，并且可以小于约200mM。“杂交缓冲液”包括缓冲盐溶液，诸如5％SSPE，或其他此类缓冲液。杂交温度可以低至5℃，但通常高于22℃，更通常高于约30℃，通常超过37℃。杂交通常在严格条件(即，在该条件下序列将与其靶序列杂交，但不会与其他非互补序列杂交)下进行。严格条件是序列依赖性的，并且在不同的情况下是不同的。例如，对于特异性杂交，较长的片段可能比较短的片段需要更高的杂交温度。由于其他因素可能影响杂交的严格度，包括互补链的碱基组成和长度、有机溶剂的存在和碱基错配的程度，所以参数的组合比任何一个参数单独的绝对度量更重要。通常严格条件被选择为在确定的离子强度和pH下比特定序列的T_m低约5℃。解链温度T_m可以是双链核酸分子群体的一半解离成单链的温度。如标准参考文献所指示，当核酸在1M NaCl的水溶液中时，T_m值的简单估计可以通过等式T_m＝81.5+0.41(％G+C)来计算(参见例如，Anderson和Young，Quantitative Filter Hybridization，于Nucleic Acid Hybridization(1985))。其他参考文献(例如，Allawi和SantaLucia，Jr.，Biochemistry，36：10581-94(1997))包括计算的替代方法，其将结构和环境以及序列特征考虑进了T_m的计算中。

通常，杂交体的稳定性是离子浓度和温度的函数。通常，杂交反应在较低严格度的条件下进行，随后以不同但更高的严格度进行洗涤。示例性的严格条件包括在约7.0至约8.3的pH和至少25℃的温度下至少0.01M至不超过1M钠离子浓度(或其他盐)的盐浓度。例如，5×SSPE(750mM NaCl、50mM磷酸钠、5mM EDTA，pH 7.4)和大约30℃的温度条件适合用于等位基因特异性杂交，尽管合适的温度取决于所杂交区域的长度和/或GC含量。在一个方面，确定百分比错配的“杂交严格度”可以如下：1)高严格度：0.1×SSPE、0.1％SDS、65℃；2)中严格度：0.2×SSPE、0.1％SDS、50℃(也称为中等严格度)；和3)低严格度：1.0×SSPE、0.1％SDS、50℃。应当理解，使用替代的缓冲液、盐和温度可以实现等同的严格度。例如，中等严格杂交可以是指允许核酸分子诸如探针结合互补核酸分子的条件。杂交的核酸分子通常具有至少60％的同一性，包括例如至少70％、75％、80％、85％、90％或95％同一性中的任一者。中等严格度条件可以是等同于在42℃下在50％甲酰胺、5×登哈特氏溶液(Denhardt’s solution)、5x SSPE、0.2％SDS中杂交，然后在42℃下在0.2×SSPE、0.2％SDS中洗涤的条件。例如，可以通过在42℃下在50％甲酰胺、5×登哈特氏溶液、5×SSPE、0.2％SDS中杂交，然后在65℃下在0.1×SSPE和0.1％SDS中洗涤来提供高严格度条件。低严格度杂交可以是指等同于在22℃下在10％甲酰胺、5×登哈特氏溶液、6×SSPE、0.2％SDS中杂交，然后在37℃下在1x sSPE、0.2％SDS中洗涤的条件。登哈特氏溶液含有1％Ficoll、1％聚乙烯吡咯烷酮和1％牛血清白蛋白(BSA)。20×SSPE(氯化钠、磷酸钠、乙二胺四乙酸(EDTA))含有3M氯化钠、0.2M磷酸钠和0.025M EDTA。其他合适的中等严格度和高严格度杂交缓冲液和条件描述于例如Sambrook等人，Molecular Cloning：A Laboratory Manual，第2版，Cold SpringHarbor Press，Plainview，N.Y.(1989)；以及Ausubel等人，Short Protocols inMolecular Biology，第4版，John Wiley&Sons(1999)。

可替代地，当RNA或DNA链将在选择性杂交条件下与其互补序列杂交时，存在实质性的互补性。通常，当在至少14个至25个核苷酸的延伸段内具有至少约65％互补性，优选地至少约75％、更优选地至少约90％互补性时，将发生选择性杂交。参见M.Kanehisa，NucleicAcids Res.12：203(1984)。

本文所用的“引物”可以是天然的或合成的寡核苷酸，其能够在与多核苷酸模板形成双链体时充当核酸合成的起始点并从其3′末端沿着模板延伸，使得形成延伸的双链体。在延伸过程期间添加的核苷酸序列由模板多核苷酸的序列决定。引物通常由DNA聚合酶延伸。

“连接”可以是指在模板驱动的反应中，在两个或更多个核酸(例如，寡核苷酸和/或多核苷酸)的末端之间形成共价键或连接。键或连接的性质可以变化很大，并且连接可以酶促进行或用化学方法进行。如本文所用，连接通常酶促进行，以在一个寡核苷酸的5′碳末端核苷酸与另一个核苷酸的3′碳之间形成磷酸二酯键。

“测序”、“序列测定”等意指测定与核酸的核苷酸碱基序列相关的信息。这种信息可以包括对核酸的部分以及全部序列信息的鉴定或测定。序列信息可以用不同程度的统计可靠性或置信度来确定。在一个方面，该术语包括确定核酸中多个连续核苷酸的同一性和排序。“高通量数字测序”或“下一代测序”意指使用以本质上平行的方式测定许多(通常数千个至数十亿个)核酸序列的方法进行的序列测定，即其中DNA模板不是一次一个地制备用于测序，而是以批量方法制备，并且其中优选平行地读出许多序列，或替代性地使用本身可以并行化的超高通量串行方法。此类方法包括但不限于：焦磷酸测序(例如，由454 LifeSciences，Inc.(Branford，Conn.)商业化)；连接法测序(例如，由Life Technologies，Inc.(Carlsbad，Calif.)以SOLiD^TM技术商业化)；使用经修饰的核苷酸边合成边测序(诸如由Illumina，Inc.(San Diego，Calif.)以TruSeq^TM和HiSeq^TM技术商业化；由HelicosBiosciences Corporation(Cambridge，Ma.)以HeliScope^TM商业化；以及由PacificBiosciences of California，Inc.(Menlo Park，Calif.)以PacBio RS商业化)、通过离子检测技术(诸如Life Technologies(Carlsbad，Calif.)的Ion Torrent^TM技术)来测序；DNA纳米球测序(Complete Genomics，Inc.(Mountain View，Calif.))；基于纳米孔的测序技术(例如，由Oxford Nanopore Technologies，LTD(Oxford，UK)开发)，以及类似的高度并行的测序方法。本文中的“多重”或“多重测定”可以是指一种测定或其他分析方法，其中可以通过使用多于一种探针同时测定多个靶标(例如，多种核酸靶序列)的存在和/或量，每种探针具有至少一个不同的检测特征，例如，荧光特征(例如激发波长、发射波长、发射强度、FWHM(半最大峰高的全宽)或荧光寿命)或独特的核酸或蛋白质序列特征。

如本文所用，术语“约”是指本技术领域的技术人员容易知道的相应值的通常误差范围。本文对“约”值或参数的引用包括(并描述)涉及该值或参数本身的实施方案。

如本文所用，单数形式“一个”、“一种”和“该”包括多个指代物，除非上下文另有明确规定。例如，“一个”或“一种”意指“至少一个(种)”或“一个(种)或多个(种)”。

在整个本公开中，各个方面以范围格式呈现。应理解，范围格式的描述仅仅是为了方便和简洁，而不应被解释为对本公开的范围的僵化限制。因此，范围的描述应被认为已经具体公开了在该范围内的所有可能的子范围以及单独的数值。例如，在提供值的范围的情况下，应理解，在该范围的上限和下限之间的每个中间值以及该陈述的范围中的任何其他陈述值或中间值均涵盖在本公开内。这些较小范围的上限和下限可独立地包括在较小范围中，并且也涵盖在本公开内，但受制于陈述的范围中的任何具体排除的极限。在陈述的范围包括这些极限中的一个或两个极限的情况下，排除那些包括的极限中的任一个或两个极限的范围也包括在本公开中。不管范围的广度如何，这都适用。

在权利要求中使用序数术语(诸如“第一”、“第二”、“第三”等)修饰权利要求元素本身并不意味着一个权利要求元素相较于执行方法的动作的另一个顺序或时间顺序的任何优先、领先或顺序，而是仅仅用作标记以将具有特定名称的一个权利要求元素与具有相同名称(但使用了序数词)的另一元素区分开，从而区分这些权利要求元素。类似地，在权利要求中使用a)、b)等或i)、ii)等本身并不意味着任何优先级、先后次序或步骤顺序。类似地，在说明书中使用这些术语本身并不意味着任何要求的优先级、先后次序或顺序。

示例性实施方案：

实施方案1.一种分析生物样品的方法，所述方法包括：

a)使所述生物样品与第一探针和第二探针接触，其中：

所述生物样品为细胞或组织样品，

所述生物样品分别在所述生物样品中的第一位置和第二位置处包含第一分析物和第二分析物，

所述第一探针和所述第二探针分别直接或间接地与所述第一分析物和所述第二分析物结合，

所述第一探针或其产物包含i)第一测序引物的第一引发位点和ii)与所述第一分析物相关联的第一标识符序列，并且

所述第二探针或其产物包含i)第二测序引物的第二引发位点和ii)与所述第二分析物相关联的第二标识符序列；

b)使用第一测序引物和第二测序引物进行第一标识符序列和第二标识符序列的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含各自对应于在连续循环中分别在第一位置和第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的信号代码，

其中在所述连续循环中的一个或多个中，在所述第一位置处检测到ON信号并且在所述第二位置处检测到OFF信号；以及

c)基于第一信号代码序列和第二信号代码序列检测生物样品中的第一标识符序列和第二标识符序列。

实施方案2.实施方案1的方法，其中第一分析物和第二分析物相同或不同。

实施方案3.实施方案1或2的方法，其中第一标识符序列和第二标识符序列是不同的。

实施方案4.实施方案1-3中任一项的方法，其中第一标识符序列和第二标识符序列包含分析物序列或其互补序列。

实施方案5.实施方案1-4中任一项的方法，其中第一标识符序列和第二标识符序列包含分别分配给第一分析物和第二分析物的条形码序列或其互补序列。

实施方案6.实施方案5的方法，所述方法包括将第一条形码序列分配给第一分析物并且将第二条形码序列分配给第二分析物。

实施方案7.实施方案6的方法，其中在特定循环中检测到的第一条形码序列中的核苷酸对应于包含ON信号的信号代码，并且在特定循环中检测到的第二条形码序列中的相应核苷酸对应于包含OFF信号的信号代码。

实施方案8.实施方案7的方法，其中在特定循环中检测到的第一条形码序列中的核苷酸仅对应于ON信号，并且在特定循环中检测到的第二条形码序列中的相应核苷酸仅对应于OFF信号。

实施方案9.实施方案6-8中任一项的方法，其中选择待在同一循环中检测的第一条形码序列和第二条形码序列中的一对或多对相应的核苷酸以减少在该循环中检测到的信号的光学拥挤。

实施方案10.实施方案1-9中任一项的方法，其中通过使生物样品与核苷酸在连续循环中接触来进行逐碱基测序，

其中在每个循环中形成复合物，所述复合物包含i)分别与第一引发位点或第二引发位点杂交的第一测序引物或第二测序引物或其延伸产物，ii)聚合酶，和iii)与第一标识符序列或第二标识符序列中的核苷酸碱基配对的同源核苷酸，并且

在所述生物样品中的特定位置处检测到与所述复合物中的所述同源核苷酸和/或所述聚合酶相关联的信号(ON信号)和/或信号缺失(OFF信号)，其中所述ON信号、所述OFF信号或其组合对应于所述同源核苷酸和所述第一标识符序列或所述第二标识符序列中的相应核苷酸中的碱基。

实施方案11.实施方案1-10中任一项的方法，其中第一标识符序列和/或第二标识符序列中25％或更多的核苷酸对应于OFF信号。

实施方案12.实施方案11的方法，其中第一标识符序列和/或第二标识符序列中40％或更多、45％或更多、50％或更多、55％或更多、60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多的核苷酸被分配为对应于OFF信号。

实施方案13.实施方案1-12中任一项的方法，其中在生物样品中检测多种不同的标识符序列，并且在生物样品中的一个或多个位置处检测每种不同的标识符序列。

实施方案14.实施方案13的方法，其中50％或更多的不同标识符序列各自在标识符序列中包含50％或更多的对应于OFF信号的核苷酸。

实施方案15.实施方案13或14的方法，其中80％或更多的不同标识符序列各自在标识符序列中包含80％或更多的对应于OFF信号的核苷酸。

实施方案16.实施方案1-15中任一项的方法，其中信号代码各自对应于第一颜色的信号、第二颜色的信号、第三颜色的信号、或信号缺失，并且其中第一、第二和第三颜色是不同的。

实施方案17.实施方案1-15中任一项的方法，其中信号代码各自对应于第一颜色的信号、第二颜色的信号、第一颜色和第二颜色的信号的组合、或信号缺失，其中第一颜色和第二颜色是不同的。

实施方案18.实施方案1-15中任一项的方法，其中信号代码各自对应于信号(ON信号)和/或信号缺失(OFF信号)的组合，其中在两个或更多个成像步骤中检测到ON和/或OFF信号的组合。

实施方案19.实施方案1-18中任一项的方法，所述方法还包括基于检测第一标识符序列和第二标识符序列来检测生物样品中的第一分析物和第二分析物。

实施方案20.实施方案1-19中任一项的方法，其中第一标识符序列为第一条形码序列或其互补序列，并且第二标识符序列为第二条形码序列或其互补序列。

实施方案21.实施方案20的方法，其中：

所述第一条形码序列鉴定所述第一分析物，并且/或者

所述第二条形码序列鉴定所述第二分析物。

实施方案22.实施方案20或21的方法，其中：

所述第一探针以直接或间接地与所述第一分析物结合的第一多种探针提供，所述第一多种探针共同包含条形码序列的第一组合，并且所述条形码序列的第一组合鉴定所述第一分析物，并且/或者

所述第二探针以直接或间接地与所述第二分析物结合的第二多种探针提供，所述第二多种探针共同包含条形码序列的第二组合，并且所述条形码序列的第二组合鉴定所述第二分析物。

实施方案23.实施方案1-19中任一项的方法，其中第一分析物和第二分析物包含核酸序列，第一标识符序列为第一分析物的序列或其互补序列，并且第二标识符序列为第二分析物的序列或其互补序列。

实施方案24.实施方案1-23中任一项的方法，其中逐碱基测序包括：

使用荧光标记的聚合酶和一种或多种未荧光标记的核苷酸；

使用聚合酶-核苷酸缀合物，所述聚合酶-核苷酸缀合物包含与未荧光标记的核苷酸部分连接的荧光标记的聚合酶；或者

使用多价聚合物-核苷酸缀合物，所述多价聚合物-核苷酸缀合物包含聚合物核心、多个核苷酸部分和一种或多种荧光标记。

实施方案25.实施方案24的方法，其中聚合酶不将同源核苷酸掺入到第一测序引物或第二测序引物或其延伸产物中。

实施方案26.实施方案24的方法，其中聚合酶将同源核苷酸掺入到第一测序引物或第二测序引物或其延伸产物中的掺入被减弱或抑制。

实施方案27.实施方案1-23中任一项的方法，其中逐碱基测序包括使生物样品与核苷酸混合物接触，该核苷酸混合物包含荧光标记的核苷酸和未荧光标记的核苷酸。

实施方案28.实施方案27的方法，其中聚合酶将同源核苷酸掺入到第一测序引物或第二测序引物或其延伸产物中，并且同源核苷酸是荧光标记的或是未荧光标记的。

实施方案29.实施方案27或28的方法，其中逐碱基测序包括：

使所述生物样品与第一核苷酸混合物接触，其中包含第一碱基的核苷酸未被可检测地标记，而包含除所述第一碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，以及

使所述生物样品与后续核苷酸混合物接触，其中包含后续碱基的核苷酸未被可检测地标记，而包含除所述后续碱基之外的碱基的核苷酸各自被标记有一种或多种可检测标记，

其中所述后续碱基与所述第一碱基相同，任选地其中所述第一碱基和所述后续碱基为A、T、C或G。

实施方案30.实施方案27或28的方法，其中逐碱基测序包括：

使所述生物样品与第一核苷酸混合物接触，其中包含第一碱基的核苷酸未被可检测地标记，而所述第一核苷酸混合物中的其他核苷酸各自被标记有一种或多种可检测标记，以及

使所述生物样品与后续核苷酸混合物接触，其中包含后续碱基的核苷酸未被可检测地标记，而所述后续核苷酸混合物中的其他核苷酸各自被标记有一种或多种可检测标记，

其中所述后续碱基不同于所述第一碱基。

实施方案31.实施方案30的方法，其中使生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：

核苷酸混合物1，其中包含G的核苷酸未被可检测地标记，而包含A、C或T的核苷酸被可检测地标记；

核苷酸混合物2，其中包含T的核苷酸未被可检测地标记，而包含A、C或G的核苷酸被可检测地标记；

核苷酸混合物3，其中包含C的核苷酸未被可检测地标记，而包含A、G或T的核苷酸被可检测地标记；以及

核苷酸混合物4，其中包含A的核苷酸未被可检测地标记，而包含G、C或T的核苷酸被可检测地标记。

实施方案32.实施方案31的方法，其中彼此独立地，每种核苷酸混合物在一个或多个循环中与生物样品接触，其中所述循环是连续的或非连续的。

实施方案33.实施方案31或32的方法，其中彼此独立地，在每种核苷酸混合物中，可检测地标记的核苷酸包含：

i)三种不同颜色的荧光标记，三种碱基中的每一种一个颜色；

ii)两种不同颜色的荧光标记，三种碱基中的两种每种一个颜色，其中包含剩余一种碱基的核苷酸用两种颜色标记；或者

iii)相同颜色的荧光标记，其中包含三种碱基中的一种的核苷酸上的荧光标记被配置成待切割，并且包含三种碱基中的另一种的核苷酸被配置成用所述荧光标记标记。

实施方案34.实施方案1-33中任一项的方法，其中第一引发位点和第二引发位点不同，并且方法包括：

b1)使所述第一测序引物与所述第一引发位点杂交并且进行逐碱基测序以生成所述第一测序引物的延伸产物和所述第一信号代码序列；

b2)去除、切割或阻断b1)中所述第一测序引物的所述延伸产物；以及

b3)使所述第二测序引物与所述第二引发位点杂交并且进行逐碱基测序以生成所述第二测序引物的延伸产物和所述第二信号代码序列。

实施方案35.实施方案34的方法，其中针对第一多种分析物的探针或其产物共享共同的第一引发位点，并且针对第二多种分析物的探针或其产物共享共同的第二引发位点。

实施方案36.实施方案35的方法，其中第二多种分析物包含两种或更多种不同的分析物，这些分析物与第一多种分析物中的两种或更多种不同的分析物不同。

实施方案37.实施方案1-36中任一项的方法，其中：

在a)中，使所述生物样品与各自被配置成直接或间接地与不同的分析物结合的多种探针接触，并且

每种探针或其产物包含不同引发位点的组合。

实施方案38.实施方案37的方法，其中：

所述第一探针或其产物包括包含所述第一引发位点的不同引发位点的第一组合，并且/或者

所述第二探针或其产物包括包含所述第二引发位点的不同引发位点的第二组合。

实施方案39.实施方案38的方法，其中：

在a)中，使所述生物样品与直接或间接地与第三分析物结合的第三探针接触，

所述第三探针或其产物包括包含所述第一引发位点、所述第二引发位点和/或第三引发位点的不同引发位点的第三组合。

实施方案40.实施方案39的方法，其中所述第一组合、第二组合和第三组合中的任何两个或更多个共享一个或多个共同的引发位点。

实施方案41.实施方案37-40中任一项的方法，所述方法包括：

b’)使所述生物样品与所述第一测序引物接触以进行逐碱基测序，从而使所述第一测序引物与所述第一探针或其产物中以及一种或多种其他探针或其产物中的所述第一引发位点杂交，并且生成所述第一测序引物的延伸产物；

b”)去除、切割或阻断b’)中所述第一测序引物的所述延伸产物；以及

b”’)使所述生物样品与所述第二测序引物接触以进行逐碱基测序，从而使所述第二测序引物与所述第二探针或其产物中以及一种或多种其他探针或其产物中的所述第二引发位点杂交，并且生成所述第二测序引物的延伸产物。

实施方案42.实施方案41的方法，其中b’)中的逐碱基测序通过如下进行：

使所述生物样品与核苷酸在连续循环中接触，

检测与每个连续循环的核苷酸掺入或结合相关联的信号，以及

生成第一多种分析物的信号代码序列。

实施方案43.实施方案41或42的方法，其中b”’)中的逐碱基测序通过如下进行：

使所述生物样品与核苷酸在连续循环中接触，

生成第二多种分析物的信号代码序列。

实施方案44.实施方案43的方法，其中第一多种分析物和第二多种分析物包含一种或多种共同的分析物。

实施方案45.实施方案43的方法，其中第一多种分析物和第二多种分析物不包含共同的分析物。

实施方案46.实施方案1-45中任一项的方法，其中每种分析物独立地为核酸分析物或非核酸分析物。

实施方案47.实施方案1-46中任一项的方法，其中每种探针独立地为i)直接地与其相应的分析物结合的初级探针，或ii)直接或间接地与初级探针结合的探针。

实施方案48.实施方案47的方法，其中初级探针和直接或间接地与初级探针结合的探针独立地选自：包含3’或5’突出部的探针，任选地其中所述3’或5’突出部包含一种或多种条形码序列；包含3’突出部和5’突出部的探针，任选地其中所述3’突出部和所述5’突出部各自独立地包含一种或多种条形码序列；环状探针；可环化探针或探针组；包含被配置成与夹板杂交的分割杂交区的探针或探针组，任选地其中所述分割杂交区包含一种或多种条形码序列；及其组合。

实施方案49.实施方案1-48中任一项的方法，其中每种探针的产物为在生物样品中原位生成的滚环扩增(RCA)产物。

实施方案50.实施方案1-49中任一项的方法，其中在b)中，逐碱基测序在生物样品中原位进行。

实施方案51.一种分析生物样品的方法，所述方法包括：

a)使所述生物样品与第一探针和第二探针接触，其中：

所述生物样品为细胞或组织样品，

b)使用第一测序引物进行第一标识符序列的逐碱基测序以生成在连续循环中在第一位置处检测到的信号代码；以及

c)随后使用第二测序引物进行第二标识符序列的逐碱基测序以生成在另外的连续循环中在第二位置处检测到的信号代码；

其中在b)中的连续循环和c)中的另外的连续循环中的至少一个或多个中，检测到OFF信号。

实施例

包括以下实施例仅用于说明目的，并不旨在限制本公开的范围。

实施例1：暗碱基

本实施例描述了使用包含条形码的探针来原位检测靶基因。探针的设计方式显著减少多轮解码期间荧光信号的光学拥挤。探针设计通过对大多数基因实现暗循环(未检测到信号，例如通过不检测核苷酸结合或掺入事件)使得能够使用边合成边测序(SBS)或边结合边测序(SBB)并行地原位检测大量靶基因。本实施例中使用的探针被配置成除了每个探针的下游条形码序列之外还具有一个引发位点以开始测序。

图2绘示了一种示例性探针及其滚环扩增(RCA)产物。该探针包含与生物样品中的靶分析物(例如，核酸，诸如mRNA分子)的序列互补的序列。该探针还包含用于与测序引物杂交的引发位点和下游标识符序列(例如，条形码序列)。条形码序列对应于探针与之杂交的分析物。因此，通过SB S或SBB鉴定条形码序列允许解码分析物。

条形码序列的设计方式使得在SBS或SBB期间，掺入(SBs)或结合(SBB)到条形码序列中的核苷酸的四种核苷酸(例如，A、T、G和C)中的一种未被荧光标记(例如，暗碱基)，而其他3种核苷酸被荧光标记。这三种核苷酸用三种不同的颜色荧光标记，每种碱基一个颜色(例如，3-通道化学，诸如A-红色、G-绿色和T-蓝色)。替代地，这三种荧光标记的核苷酸可用两种不同的颜色标记，三种碱基中的两种每种一个颜色，其中包含剩余一种碱基的核苷酸用两种颜色标记(例如，2-通道化学，诸如A-红色、G-绿色和T-(红色和绿色))。替代地，这三种荧光标记的核苷酸可用相同的颜色标记，其中荧光标记可被配置成待切割(例如，1-通道化学)。在另一个实例中，两种核苷酸是荧光标记的核苷酸，另外两种核苷酸是未荧光标记的。

此外，条形码序列被设计成使得序列中的大多数碱基为暗碱基，其中条形码序列中的大多数碱基与未被可检测地标记的核苷酸配对。条形码序列内只有少数碱基与荧光标记的核苷酸杂交。例如，条形码序列可包含其中绝大多数(例如，80％)包含暗碱基G的核苷酸。在这种情况下，荧光标记的核苷酸A、C和T将与条形码序列内的同源T、G和A核苷酸碱基配对。未荧光标记的同源核苷酸C将与条形码序列的暗碱基G杂交。在各个循环中，可以切换指定为暗碱基的核苷酸。在这种情况下，80％的核苷酸仅对应于OFF信号。替代地，条形码序列中30％或更多、40％或更多、50％或更多、60％或更多、70％或更多、80％或更多、或90％或更多的核苷酸可对应于OFF信号。使用具有如上所述的条形码设计的探针可以减少在多轮解码期间检测到的信号的光学拥挤。在一些情况下，每个代码字中可能需要指定数量的ON位。例如，每个代码字可能包含对应于至少2、3或4个不同颜色通道中的信号的5个ON位/循环，以允许将成像特征与往往在单一颜色通道中发射的背景荧光源区分开来。

将靶向生物样品中两个不同位置处的第一分析物和第二分析物的第一探针和第二探针合并。然后将探针混合物与生物样品(例如，细胞培养物样品或薄组织切片样品)以及杂交缓冲液一起温育，以与样品中的靶分析物杂交。洗涤样品以去除过量或未结合的探针，并与连接酶(例如，T4DNA连接酶)一起温育以连接探针。将连接产物与含有聚合酶和dNTP的滚环扩增(RCA)混合物一起温育。在杂交、连接和扩增之后，对RCA产物测序以解码靶分析物。为了测序，将样品与含有将与引发位点结合的测序引物、聚合酶和核苷酸混合物(例如，标记和未标记的核苷酸)的混合物一起温育。第一探针或其扩增产物包含第一测序引物的第一引发位点和第一条形码序列，诸如上文描述的那些。第二探针或其扩增产物包含第二测序引物的第二引发位点和第二条形码序列，诸如上文描述的那些。

通过将样品与核苷酸混合物一起温育来开始第一条形码和第二条形码的测序(例如，SBS)，其中核苷酸包含一种未被荧光标记的碱基(例如，C)(例如，暗碱基)，而其他三种碱基是被荧光标记的。随着测序的进行，生成荧光信号代码并成像。生成第一信号代码和第二信号代码，每个信号代码分别对应于样品中两个位置处的信号(例如，ON信号)或信号缺失(例如，OFF信号)。具体而言，在一个测序循环中检测到的第一条形码序列中的核苷酸对应于包含ON信号的信号代码，并且在同一循环中检测到的第二条形码序列中的相应核苷酸对应于包含OFF信号的信号代码。在一些情况下，在两个测序循环之间，在下一轮之前存在链终止和终止逆转。例如，核苷酸混合物可包含可逆地终止的核苷酸以将SB S方法限制于单个核苷酸的掺入，并可在每个测序循环之后在开始下一测序循环之前去除可逆终止基团。进行下一轮解码，其中后续核苷酸碱基与第一条形码序列和第二条形码序列中的其同源核苷酸配对。再次生成信号代码，其中每种信号代码对应于信号缺失(OFF信号)或第一、第二、第三或第四颜色的信号的存在(ON信号)。在一些方面，信号代码可对应于任何颜色或其缺失的组合。特别选择待在同一循环中检测的第一条形码序列和第二条形码序列中的相应核苷酸对以减少在循环中检测到的信号的光学拥挤。

原位进行多个循环的测序以完全解码第一条形码序列和第二条形码序列，同时减少解码轮次期间信号的光学拥挤。由于条形码序列对应于探针与之杂交的分析物的身份，故在测序期间生成的信号代码使得能够鉴定第一分析物和第二分析物。以这种方式，可以并行地检测组织或细胞样品中的大量基因而不会在样品中出现光学拥挤。

实施例2：在解码循环期间使用不同的核苷酸混合物

本实施例描述了一种使用实施例1中公开的探针和不同的核苷酸混合物减少信号的光学拥挤的方法。通过改变每种混合物中暗碱基的分配来生成不同的核苷酸混合物并在每轮解码中使用不同的混合物。以这种方式，暗碱基的身份是循环依赖性的。本文描述的方法提供了减少原位光学拥挤而不在条形码序列中产生可能干扰测序化学的相同碱基的大段的优点。在一些情况下，暗碱基在每一轮中是不同的核苷酸，不需要将给定的碱基牺牲到暗通道，从而改善基因的分析。

在本实施例中，探针设计类似于实施例1中描述的探针设计。探针包含与靶分析物互补的序列、用于开始测序的引发位点和下游条形码序列。本实施例中设计的条形码序列在碱基平衡方面更加均匀。例如，条形码序列可以包含相等比例(25％)的A、T、C和G碱基。在一些方面，条形码序列可以具有任何比例或组合的A、T、G和C。本实施例中公开的方法在每轮解码中使用不同的核苷酸混合物。每轮中的核苷酸混合物含有不同的暗碱基。

将靶向生物样品中两个不同位置处的第一分析物和第二分析物的第一探针和第二探针合并。然后将探针混合物与生物样品(例如，细胞培养物样品或薄组织切片样品)以及杂交缓冲液一起温育，以与样品中的靶分析物杂交。洗涤样品以去除过量或未结合的探针，并与连接酶(例如，T4DNA连接酶)一起温育以连接探针。将连接产物与含有聚合酶和dNTP的滚环扩增(RCA)混合物一起温育。在杂交、连接和扩增之后，对RCA产物测序以解码靶分析物。为了测序，将样品与含有将与引发位点结合的测序引物、聚合酶和每个循环特定的核苷酸混合物(例如，标记和未标记的核苷酸)的混合物一起温育。第一探针或其扩增产物包含第一测序引物的第一引发位点和第一条形码序列，诸如实施例2中描述的那些。在一些方面，第二探针或其产物包含第二测序引物的第二引发位点和第二条形码序列，诸如实施例2中描述的那些。

通过将样品与第一核苷酸混合物一起温育来开始第一条形码和第二条形码的测序(例如，SBS)，其中核苷酸包含一种未被荧光标记的碱基(例如，第一碱基)，而第一核苷酸混合物中的其他核苷酸各自被标记有一种或多种荧光标记。例如，第一核苷酸混合物含有核苷酸A-红色标记、C-绿色标记、T-蓝色标记，而核苷酸G未被标记并且是暗碱基。随着测序开始，对生成的荧光信号代码成像。信号代码以这样的方式生成：在第一循环中检测到的第一条形码序列中的核苷酸对应于包含ON信号的信号代码，并且在同一循环中检测到的第二条形码序列中的相应核苷酸对应于包含OFF信号或不同颜色的ON信号的信号代码。在一些情况下，核苷酸混合物可包含可逆地终止的核苷酸以将SBS方法限制于单个核苷酸的掺入，并可在每个测序循环之后在开始下一测序循环之前去除可逆终止基团并允许核苷酸掺入。进行下一轮解码，其中洗涤样品并温育第二核苷酸混合物。第二核苷酸混合物含有不同的暗碱基，而混合物中的其他核苷酸各自被标记有一种或多种荧光标记。第二轮中未荧光标记的暗碱基不同于前一轮中在第一核苷酸混合物中使用的暗碱基。例如，第一核苷酸混合物含有核苷酸A-红色标记、C-绿色标记、T-蓝色标记，而核苷酸G未被标记并且是暗碱基。第二核苷酸混合物含有核苷酸A-绿色标记、C-蓝色标记、G-红色标记，而T未被标记并且是暗碱基。以这种方式，在解码的连续循环中将生物样品与不同的核苷酸混合物一起温育。接下来，使用含有T-绿色标记、C-蓝色标记、G-红色标记并且A为暗碱基的第三核苷酸混合物。在每种核苷酸混合物中，三种荧光标记的核苷酸用三种不同的颜色标记，每种碱基一个颜色(例如，3-通道化学，诸如A-红色、G-绿色和T-蓝色)。替代地，三种荧光标记的核苷酸可用两种不同的颜色标记，三种碱基中的两种每种一个颜色，其中包含剩余一种碱基的核苷酸用两种颜色标记(例如，2-通道化学，诸如A-红色、G-绿色和T-(红色和绿色))。替代地，三种荧光标记的核苷酸可用相同的颜色标记，其中核苷酸上的荧光标记被配置成待切割(例如，1-通道化学)。

原位进行多个循环的测序以解码第一条形码序列和第二条形码序列，同时减少解码轮次期间信号的光学拥挤。因此，基于在对第一条形码序列和第二条形码序列测序时生成的信号代码来鉴定第一分析物和第二分析物。以这种方式，可以并行地检测组织或细胞样品中的大量基因而不产生暗循环的大段。

实施例3：使用共同的测序引物来解码不同分析物的给定块的方法

本实施例描述了一种通过顺序解码基因簇来原位检测众多基因而不使生物样品光学拥挤的方法。本实施例中公开的方法利用相对简单的探针设计，其包含每个探针一个引发位点和条形码，如实施例1和2中所述。然而，引发位点对于与样品中的不同分析物杂交的一组探针是共同的。

如图3中所示意，分析在六个不同的位置处包含六种分析物(例如，基因)的生物样品。将靶向六种分析物的六种不同探针合并，与生物样品(例如，组织样品或细胞样品)和杂交缓冲液一起温育以与靶分析物杂交。洗涤样品以去除过量或未结合的探针，并与连接酶(例如，T4 DNA连接酶)一起温育以连接探针。将连接产物与含有聚合酶和dNTP的滚环扩增(RCA)混合物一起温育。在杂交、连接和扩增之后，对RCA产物测序以解码靶分析物。为了测序，将样品与含有聚合酶、核苷酸混合物(例如，标记和未标记的核苷酸)和测序引物-1的混合物一起温育。测序引物-1退火到存在于与分析物1、2和3杂交的第一组探针内的共同引发位点(如图3中的红色所示)。通过将样品与核苷酸混合物一起温育来开始第一组探针(图3中的基因块1)的测序(例如，SBS)，其中核苷酸包含至少一种未被荧光标记的碱基(例如，C)(例如，暗碱基)，而其他碱基是被荧光标记的。随着测序的进行，在每一轮解码中生成对应于ON和OFF信号的组合的荧光信号代码并成像(图2)，如实施例1和2中所述。一旦对第一组或基因块1的探针内的条形码序列测序，就经由剥离或切割去除测序引物-1。在一些情况下，还可阻断测序引物延伸产物以阻止进一步的核苷酸掺入或结合。接下来，洗涤样品并与测序引物-2一起温育，该测序引物退火到存在于与分析物4、5和6杂交的第二组探针内的共同引发位点(如图3中的蓝色所示)。通过将样品与核苷酸混合物一起温育来开始第二组探针(图3中的基因块2)的测序(例如，SBS)，其中核苷酸包含一种未被荧光标记的碱基(例如，A)(例如，暗碱基)，而其他三种碱基是被荧光标记的。随着测序的进行，在每一轮解码中生成对应于ON和OFF信号的组合的荧光信号代码并成像(图2)，如实施例1和2中所述。

在本实施例中，解码轮次被分成块(例如，块对角代码)，其中每个块包含一组与包含共同引发位点的探针结合的分析物。在一些情况下，使用块对角代码意味着仅非零状态处于块或子矩阵中。因此，块对角代码可能密集地堆积在基因的位置内。然而，本实施例中公开的方法使得能够通过顺序解码基因簇来原位检测大量靶基因而不使生物样品光学拥挤。

实施例4：使用多种测序引物来解码相同分析物的方法

本实施例描述了一种并行地检测许多基因而不受块对角代码约束的方法。本实施例中描述的探针和方法显著减少了荧光信号的光学拥挤，同时优化了编码信号代码序列的效率。

本实施例中使用的探针各自包含两个或更多个引发位点和相应的条形码序列。如图4中所示意，与基因1杂交的探针包含测序引物1和2的引发位点，与基因2杂交的探针包含测序引物1和3的引发位点，与基因3杂交的探针包含测序引物1和4的引发位点，与基因4杂交的探针包含测序引物2和4的引发位点，与基因5杂交的探针包含测序引物2和4的引发位点。每种探针还包含在引发位点下游的相应条形码。此外，两种不同的探针可以具有共同的测序引发位点并具有第二唯一的引发位点。

分析在五个不同位置处包含五种不同分析物(例如，基因)的生物样品。将靶向五种分析物的五种不同探针合并，与生物样品(例如，组织样品或细胞样品)和杂交缓冲液一起温育以与靶分析物杂交。洗涤样品以去除过量或未结合的探针，并与连接酶(例如，T4DNA连接酶)一起温育以连接探针。将连接产物与含有聚合酶和dNTP的滚环扩增(RCA)混合物一起温育。在杂交、连接和扩增之后，对RCA产物测序以解码靶分析物。为了测序，将样品与含有聚合酶、核苷酸混合物(例如，标记和未标记的核苷酸)和测序引物混合物(例如，如图4中所示的测序引物1)的混合物一起温育。测序引物1的混合物退火到与基因1、2和3杂交的探针。通过将样品与核苷酸混合物一起温育来开始测序(例如，SBS)，其中核苷酸包含一种未被荧光标记的碱基(例如，G)(例如，暗碱基)，而其他三种碱基是被荧光标记的。随着测序的进行，在每一轮解码中对基因1、2和3生成对应于ON和OFF信号的组合的荧光信号代码并成像(图4)，如实施例1和2中所述。对于与基因1、2和3结合的探针，没有从第二引发位点下游的条形码获取到信号。类似地，与基因4和5结合的探针也保持暗色。在多轮解码之后，对测序引物1下游的条形码序列解码并剥离测序引物1。然后洗涤样品以去除测序引物。然后将样品与测序引物(例如，测序引物2)的后续混合物一起温育。测序引物2的混合物退火到与基因1、4和5杂交的探针。类似地，开始测序，在基因1、4和5的位置处生成对应于ON和OFF信号的组合的荧光信号代码。在多轮解码之后，对测序引物2下游的条形码序列解码并部分地鉴定基因1、4。以这种方式，进行多次循环的测序引物混合物杂交、测序、解码、剥离和新的测序引物混合物的再杂交，直至对给定探针内的所有条形码解码并鉴定出分析物。

在本实施例中，可以并行地检测大量基因而不受块对角代码的约束。使用测序引物的组合，可以混合和匹配不同的测序引物以用于对基因测序中，并且这可以允许代码增加的复杂性。当同时解码若干基因内的条形码时，生成的信号代码序列在空间上分散，从而优化编码信号的效率。本文公开的方法允许并行地原位险测众多基因而不使样品光学拥挤。

本公开的范围并非旨在限于所公开的特定实施方案，这些实施方案是例如为了举例说明本公开的各方面而提供的。根据本文的描述和教导，对所描述的这些组合物和方法的各种修改将变得显而易见。可以在不脱离本公开的真实范围和实质的情况下实践此类变化，并且此类变化旨在落入本公开的范围内。

Claims

1.一种分析生物样品的方法，所述方法包括：

a)使所述生物样品与第一探针和第二探针接触，其中：

所述生物样品为细胞或组织样品，

b)使用所述第一测序引物和所述第二测序引物进行所述第一标识符序列和所述第二标识符序列的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含各自对应于在连续循环中分别在所述第一位置和所述第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的信号代码，

c)至少基于所述第一信号代码序列和所述第二信号代码序列检测所述生物样品中的所述第一标识符序列和所述第二标识符序列。

2.根据权利要求1所述的方法，其中所述第一分析物和所述第二分析物相同或不同。

3.根据权利要求1或2所述的方法，其中所述第一标识符序列和所述第二标识符序列是不同的。

4.根据权利要求1-3中任一项所述的方法，其中所述第一标识符序列和所述第二标识符序列包含分析物序列或其互补序列。

5.根据权利要求1-4中任一项所述的方法，其中所述第一标识符序列和所述第二标识符序列包含分别分配给所述第一分析物和所述第二分析物的条形码序列或其互补序列。

6.根据权利要求5所述的方法，所述方法包括将第一条形码序列分配给所述第一分析物并且将第二条形码序列分配给所述第二分析物。

7.根据权利要求6所述的方法，其中分配所述条形码序列基于设计成最小化在一个或多个所述连续循环中的每一个中检测到的ON信号的最大预测密度的决策规则。

8.根据权利要求6所述的方法，其中将所述第一条形码序列分配给所述第一分析物并且将所述第二条形码序列分配给所述第二分析物包括基于所述第一分析物和所述第二分析物的表达数据的分配。

9.根据权利要求8所述的方法，其中将所述第一条形码序列分配给所述第一分析物并且将所述第二条形码序列分配给所述第二分析物包括基于聚类细胞类型中所述第一分析物和所述第二分析物的表达数据的分配。

10.根据权利要求9所述的方法，其中所述聚类细胞类型代表存在于所述生物样品中的细胞类型的分布。

11.根据权利要求8-10中任一项所述的方法，其中所述第一分析物和所述第二分析物的所述表达数据至少部分地重叠。

12.根据权利要求8-11中任一项所述的方法，其中所述第一分析物和所述第二分析物的所述表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

13.根据权利要求6-12中任一项所述的方法，其中在特定循环中检测到的所述第一条形码序列中的核苷酸对应于包含ON信号的信号代码，并且在所述特定循环中检测到的所述第二条形码序列中的相应核苷酸对应于包含OFF信号的信号代码。

14.根据权利要求13所述的方法，其中在所述特定循环中检测到的所述第一条形码序列中的核苷酸仅对应于ON信号，并且在所述特定循环中检测到的所述第二条形码序列中的相应核苷酸仅对应于OFF信号。

15.根据权利要求6-14中任一项所述的方法，其中选择待在同一循环中检测的所述第一条形码序列和所述第二条形码序列中的一对或多对相应的核苷酸以减少在所述循环中检测到的信号的光学拥挤。

16.根据权利要求1-15中任一项所述的方法，其中通过使所述生物样品与核苷酸在连续循环中接触来进行逐碱基测序，

其中在每个循环中形成复合物，所述复合物包含i)分别与所述第一引发位点或所述第二引发位点杂交的所述第一测序引物或所述第二测序引物或其延伸产物，ii)聚合酶，和iii)与所述第一标识符序列或所述第二标识符序列中的核苷酸碱基配对的同源核苷酸，并且

17.根据权利要求1-16中任一项所述的方法，其中所述第一标识符序列和/或所述第二标识符序列中25％或更多的核苷酸对应于OFF信号。

18.根据权利要求17所述的方法，其中所述第一标识符序列和/或所述第二标识符序列中40％或更多、45％或更多、50％或更多、55％或更多、60％或更多、65％或更多、70％或更多、75％或更多、80％或更多、85％或更多、90％或更多、或95％或更多的核苷酸被分配为对应于OFF信号。

19.根据权利要求1-18中任一项所述的方法，其中在所述生物样品中检测多种不同的标识符序列，并且在所述生物样品中的一个或多个位置处检测每种不同的标识符序列。

20.根据权利要求19所述的方法，其中50％或更多的所述不同标识符序列各自在所述标识符序列中包含50％或更多的对应于OFF信号的核苷酸。

21.根据权利要求19或20所述的方法，其中80％或更多的所述不同标识符序列各自在所述标识符序列中包含80％或更多的对应于OFF信号的核苷酸。

22.根据权利要求1-21中任一项所述的方法，其中所述信号代码各自对应于第一颜色的信号、第二颜色的信号、第三颜色的信号、或信号缺失，并且其中所述第一颜色、所述第二颜色和所述第三颜色是不同的。

23.根据权利要求1-21中任一项所述的方法，其中所述信号代码各自对应于第一颜色的信号、第二颜色的信号、所述第一颜色和所述第二颜色的信号的组合、或信号缺失，其中所述第一颜色和所述第二颜色是不同的。

24.根据权利要求1-23中任一项所述的方法，其中所述信号代码各自对应于信号(ON信号)和/或信号缺失(OFF信号)的组合，其中在两个或更多个成像步骤中检测到所述ON和/或OFF信号的组合。

25.根据权利要求1-24中任一项所述的方法，所述方法还包括基于检测所述第一标识符序列和所述第二标识符序列来检测所述生物样品中的所述第一分析物和所述第二分析物。

26.根据权利要求1-25中任一项所述的方法，其中所述第一标识符序列为第一条形码序列或其互补序列，并且所述第二标识符序列为第二条形码序列或其互补序列。

27.根据权利要求26所述的方法，其中：

所述第一条形码序列鉴定所述第一分析物，并且/或者

所述第二条形码序列鉴定所述第二分析物。

28.根据权利要求26或27所述的方法，其中：

29.根据权利要求1-28中任一项所述的方法，其中所述第一分析物和所述第二分析物包含核酸序列，所述第一标识符序列为所述第一分析物的序列或其互补序列，并且所述第二标识符序列为所述第二分析物的序列或其互补序列。

30.根据权利要求1-29中任一项所述的方法，其中所述逐碱基测序包括：

使用荧光标记的聚合酶和一种或多种未荧光标记的核苷酸；

31.根据权利要求30所述的方法，其中所述聚合酶不将同源核苷酸掺入到所述第一测序引物或所述第二测序引物或其延伸产物中。

32.根据权利要求30所述的方法，其中所述聚合酶将同源核苷酸掺入到所述第一测序引物或所述第二测序引物或其延伸产物中的掺入被减弱或抑制。

33.根据权利要求1-32中任一项所述的方法，其中所述逐碱基测序包括使所述生物样品与核苷酸混合物接触，所述核苷酸混合物包含荧光标记的核苷酸和未荧光标记的核苷酸。

34.根据权利要求33所述的方法，其中聚合酶将同源核苷酸掺入到所述第一测序引物或所述第二测序引物或其延伸产物中，并且所述同源核苷酸是荧光标记的或是未荧光标记的。

35.根据权利要求33或34所述的方法，其中所述逐碱基测序包括：

36.根据权利要求33或34所述的方法，其中所述逐碱基测序包括：

其中所述后续碱基不同于所述第一碱基。

37.根据权利要求36所述的方法，其中使所述生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：

38.根据权利要求37所述的方法，其中彼此独立地，每种核苷酸混合物在一个或多个循环中与所述生物样品接触，其中所述循环是连续的或非连续的。

39.根据权利要求37或38所述的方法，其中彼此独立地，在每种核苷酸混合物中，可检测地标记的核苷酸包含：

40.根据权利要求36所述的方法，其中使所述生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：

核苷酸混合物1，其中包含G或A的核苷酸未被可检测地标记，而包含C或T的核苷酸被可检测地标记；

核苷酸混合物2，其中包含G或T的核苷酸未被可检测地标记，而包含C或A的核苷酸被可检测地标记；

核苷酸混合物3，其中包含G或C的核苷酸未被可检测地标记，而包含A或T的核苷酸被可检测地标记；

核苷酸混合物4，其中包含C或A的核苷酸未被可检测地标记，而包含G或T的核苷酸被可检测地标记；

核苷酸混合物5，其中包含C或T的核苷酸未被可检测地标记，而包含G或A的核苷酸被可检测地标记；以及

核苷酸混合物6，其中包含A或T的核苷酸未被可检测地标记，而包含G或C的核苷酸被可检测地标记。

41.根据权利要求1-40中任一项所述的方法，其中所述第一引发位点和所述第二引发位点不同，并且所述方法包括：

42.根据权利要求41所述的方法，其中针对第一多种分析物的探针或其产物共享共同的第一引发位点，并且针对第二多种分析物的探针或其产物共享共同的第二引发位点。

43.根据权利要求42所述的方法，其中所述第二多种分析物包含两种或更多种不同的分析物，这些分析物与所述第一多种分析物中的两种或更多种不同的分析物不同。

44.根据权利要求1-43中任一项所述的方法，其中：

每种探针或其产物包含不同引发位点的组合。

45.根据权利要求44所述的方法，其中：

46.根据权利要求45所述的方法，其中：

47.根据权利要求46所述的方法，其中所述第一组合、所述第二组合和所述第三组合中的任何两个或更多个共享一个或多个共同的引发位点。

48.根据权利要求44-47中任一项所述的方法，所述方法包括：

49.根据权利要求48所述的方法，其中b’)中的所述逐碱基测序通过如下进行：

使所述生物样品与核苷酸在连续循环中接触，

生成第一多种分析物的信号代码序列。

50.根据权利要求48或49所述的方法，其中b”’)中的所述逐碱基测序通过如下进行：

使所述生物样品与核苷酸在连续循环中接触，

生成第二多种分析物的信号代码序列。

51.根据权利要求50所述的方法，其中所述第一多种分析物和所述第二多种分析物包含一种或多种共同的分析物。

52.根据权利要求50所述的方法，其中所述第一多种分析物和所述第二多种分析物不包含共同的分析物。

53.根据权利要求1-52中任一项所述的方法，其中每种分析物独立地为核酸分析物或非核酸分析物。

54.根据权利要求1-53中任一项所述的方法，其中每种探针独立地为i)直接地与其相应的分析物结合的初级探针，或ii)直接或间接地与所述初级探针结合的探针。

55.根据权利要求54所述的方法，其中所述初级探针和所述直接或间接地与所述初级探针结合的探针独立地选自：包含3’或5’突出部的探针，任选地其中所述3’或5’突出部包含一种或多种条形码序列；包含3’突出部和5’突出部的探针，任选地其中所述3’突出部和所述5’突出部各自独立地包含一种或多种条形码序列；环状探针；可环化探针或探针组；包含被配置成与夹板杂交的分割杂交区的探针或探针组，任选地其中所述分割杂交区包含一种或多种条形码序列；及其组合。

56.根据权利要求1-55中任一项所述的方法，其中每种探针的所述产物为在所述生物样品中原位生成的滚环扩增(RCA)产物或在所述生物样品中原位形成的分支结构的组件。

57.根据权利要求1-56中任一项所述的方法，其中在b)中，所述逐碱基测序在所述生物样品中原位进行。

58.一种分析生物样品的方法，所述方法包括：

a)使所述生物样品与第一探针和第二探针接触，其中：

所述生物样品为细胞或组织样品，

b)使用所述第一测序引物进行所述第一标识符序列的逐碱基测序以生成第一信号代码序列，所述第一信号代码序列包含在连续循环中在所述第一位置处检测到的信号代码，其中信号代码对应于信号(ON信号)、信号缺失(OFF信号)或其组合；

c)随后使用所述第二测序引物进行所述第二标识符序列的逐碱基测序以生成第二信号代码序列，所述第二信号代码序列包含在另外的连续循环中在所述第二位置处检测到的信号代码；

其中在b)中的所述连续循环和c)中的所述另外的连续循环中的至少一个或多个中，检测到OFF信号；以及

d)至少部分地基于所述第一信号代码序列和所述第二信号代码序列分别检测所述生物样品中所述第一位置和所述第二位置处的所述第一标识符序列和所述第二标识符序列。

59.根据权利要求58所述的方法，其中所述第一标识符序列和所述第二标识符序列是相同的。

60.根据权利要求58所述的方法，其中所述第一标识符序列和所述第二标识符序列是不同的。

61.根据权利要求58-60中任一项所述的方法，其中所述第一标识符序列和所述第二标识符序列包含分别分配给所述第一分析物和所述第二分析物的条形码序列或其互补序列。

62.根据权利要求61所述的方法，其中基于设计成最小化在一个或多个所述连续循环中的每一个中检测到的ON信号的最大预测密度的决策规则，所述第一引发位点和/或所述第一条形码序列被分配给所述第一分析物，并且所述第二引发位点和/或所述第二条形码序列被分配给所述第二分析物。

63.根据权利要求61所述的方法，其中所述分配包括基于所述第一分析物和所述第二分析物的表达数据的分配。

64.根据权利要求63所述的方法，其中所述分配包括基于聚类细胞类型中所述第一分析物和所述第二分析物的表达数据的分配。

65.根据权利要求64所述的方法，其中所述聚类细胞类型代表存在于所述生物样品中的细胞类型的分布。

66.根据权利要求63-65中任一项所述的方法，其中所述第一分析物和所述第二分析物的所述表达数据至少部分地重叠。

67.根据权利要求63-66中任一项所述的方法，其中所述第一分析物和所述第二分析物的所述表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

68.根据权利要求58-67中任一项所述的方法，其中在特定的循环中检测到的所述第一条形码序列或第二条形码序列中的核苷酸对应于包含ON信号的信号代码。

69.根据权利要求58-68中任一项所述的方法，其中在特定的循环中检测到的所述第一条形码序列或第二条形码序列中的核苷酸对应于包含OFF信号的信号代码。

70.根据权利要求68或权利要求69所述的方法，其中在所述特定的循环中检测到的所述第一条形码序列或第二条形码序列中的所述核苷酸仅对应于ON信号。

71.根据权利要求69或权利要求70所述的方法，其中在所述特定的循环中检测到的所述第一条形码序列或第二条形码序列中的所述核苷酸仅对应于OFF信号。

72.一种用于解码生物样品中的标识符序列同时最小化光学拥挤的方法，所述方法包括：

a)使所述生物样品与第一探针和第二探针接触，其中：

所述生物样品为细胞或组织样品，

b)使用所述第一测序引物和所述第二测序引物进行所述第一标识符序列和所述第二标识符序列的逐碱基测序，从而生成第一信号代码序列和第二信号代码序列，每个信号代码序列包含对应于在连续测序循环中分别在所述第一位置和所述第二位置处检测到的信号(ON信号)、信号缺失(OFF信号)或其组合的信号代码，

其中所述逐碱基测序包括在每个连续循环中使所述生物样品与聚合酶和核苷酸混合物接触，其中：i)至少一种核苷酸(例如，A、T/U、CC或G)未被可检测地标记；ii)从所述混合物中省略至少一种核苷酸(例如，A、T/U、C或G)；或iii)在c)中不检测至少一种核苷酸(例如，A、T/U、C或G)；以及

73.根据权利要求72所述的方法，其中所述第一分析物和所述第二分析物相同或不同。

74.根据权利要求72或73所述的方法，其中所述第一标识符序列和所述第二标识符序列是不同的。

75.根据权利要求72-74中任一项所述的方法，其中所述第一标识符序列和所述第二标识符序列包含分析物序列或其互补序列。

76.根据权利要求72-75中任一项所述的方法，其中所述第一标识符序列和所述第二标识符序列包含分别分配给所述第一分析物和所述第二分析物的条形码序列或其互补序列。

77.根据权利要求76所述的方法，所述方法包括将第一条形码序列分配给所述第一分析物并且将第二条形码序列分配给所述第二分析物。

78.根据权利要求77所述的方法，其中分配所述条形码序列基于设计成最小化在一个或多个所述连续循环中的每一个中检测到的ON信号的最大预测密度的决策规则。

79.根据权利要求77所述的方法，其中将所述第一条形码序列分配给所述第一分析物并且将所述第二条形码序列分配给所述第二分析物的所述决策规则包括基于所述第一分析物和所述第二分析物的表达数据的分配。

80.根据权利要求79所述的方法，其中将所述第一条形码序列分配给所述第一分析物并且将所述第二条形码序列分配给所述第二分析物包括基于聚类细胞类型中所述第一分析物和所述第二分析物的表达数据的分配。

81.根据权利要求80所述的方法，其中所述聚类细胞类型代表存在于所述生物样品中的细胞类型的分布。

82.根据权利要求79-81中任一项所述的方法，其中所述第一分析物和所述第二分析物的所述表达数据至少部分地重叠。

83.根据权利要求79-82中任一项所述的方法，其中所述第一分析物和所述第二分析物的所述表达数据包括批量基因表达数据、批量蛋白质表达数据、空间基因表达数据、空间蛋白质表达数据、单细胞基因表达数据、单细胞蛋白质表达数据或其任何组合。

84.根据权利要求72-83中任一项所述的方法，其中所述核苷酸混合物包含至少两种未被可检测地标记的核苷酸。

85.根据权利要求72-83中任一项所述的方法，其中使所述生物样品以任何顺序在连续测序循环中与以下核苷酸混合物中的两种或更多种接触：

86.根据权利要求85所述的方法，其中彼此独立地，每种核苷酸混合物在一个或多个循环中与所述生物样品接触，其中所述循环是连续的或非连续的。

87.根据权利要求85或86所述的方法，其中彼此独立地，在每种核苷酸混合物中，可检测地标记的核苷酸包含：

88.根据权利要求72至83中任一项所述的方法，其中使所述生物样品以任何顺序在连续循环中与以下核苷酸混合物中的两种或更多种接触：

核苷酸混合物3，其中包含G或C的核苷酸未被可检测地标记，而包含A或T的核苷酸被可检测地标记；以及