直达靶心的捷径：适应性采样——省时省钱的靶向长读长测序方案

在临床研究、病原体监测和物种鉴定等领域，研究人员常常只需要分析基因组中的特定部分，而非整个基因组。靶向测序技术应运而生，它能够选择性地对目标区域进行测序富集或剔除非目标区域，大幅提升分析效率。Oxford Nanopore Technologies (ONT) 开发了一项名为“适应性采样”(Adaptive Sampling) 的独特技术，无需特殊文库制备即可实现这一目标。

靶向测序的必要性

对整个样本进行测序（全基因组测序，WGS）虽然全面，但存在局限：当目标区域仅占基因组一小部分，或需要从复杂微生物群落中获取特定微生物信息时，WGS 可能无法为目标区域提供足够的覆盖深度。额外的测序不仅增加成本和时间，也加剧了数据管理的复杂性。

靶向测序则能精准聚焦目标区域，以更快、更高效的工作流程获得所需区域的高深度覆盖数据。

传统靶向测序方法的局限

传统方法依赖文库制备阶段进行目标富集。

常用方法包括：

1. 靶向 PCR (扩增子测序)：流程相对简单经济。但 PCR 本身存在缺陷：难以扩增 GC 富含区或重复序列；读长受聚合酶限制；引入扩增偏差；破坏天然的表观遗传修饰。若结合短读长测序技术，则更难以分析结构变异 (SV) 等大片段区域。

2. 杂交捕获：适用于大区域富集，但同样需要 PCR 步骤，流程复杂冗长。

3. 去除技术 (如宿主 DNA 去除)：需要额外步骤去除不需要的 DNA。

这些方法都涉及额外的湿实验操作，增加了时间和复杂性。

适应性采样：突破性的实时靶向方法

适应性采样彻底改变了靶向测序模式，将富集或去除过程完全集成到实时测序环节中。这种基于软件的方法具有显著优势：

✔ 保留长读长与原始 DNA：能够分析以往难以测序的区域，如复杂 SV、长重复序列、GC 富含区，并直接检测基因组变异和原始碱基修饰。

✔ 工作流程快速简单：无需 PCR、探针或额外湿实验步骤。

✔ 高度灵活：只需编辑一个包含目标坐标的 BED 文件即可快速更新靶标，无需复杂的面板优化。

工作原理：智能选择，实时决策

适应性采样利用了 ONT 实时测序和碱基识别的特点：

1.用户通过 BED 文件定义需要富集或去除的基因组区域及其参考序列。

2.DNA 分子开始通过纳米孔时，其起始部分序列会实时生成。

3.软件立即将此起始序列与目标列表进行比对：

• 若匹配富集目标，或不在去除名单内 → 继续完整测序该分子。

• 若不匹配富集目标，或属于去除区域 → 软件指令迅速排出该 DNA 分子，让位给下一条分子。

4.此过程显著提高了目标区域的覆盖深度（通常单张 MinION 芯片可富集 5-10 倍，达到 20-40x 平均覆盖深度，可靶向约 10% 的人类基因组）。

应用前景广阔

宏基因组学与环境微生物组研究

(1) 稀有/低丰度微生物的靶向富集

在复杂环境样本（如土壤、水体、共生体）中，99%以上的微生物可能是未知或难以培养的。适应性采样可以：

▪ “剔除”优势物种：实时去除已知或高丰度微生物（如去除样本中大量存在的变形菌门序列），迫使设备优先测序稀有的、未被充分研究的微生物基因组片段。

▪ 富集特定功能基因/通路：靶向富集参与关键生物地球化学循环的基因（如固氮基因nifH、氨氧化基因amoA、抗生素抗性基因等），研究其在群落中的分布、多样性和进化。

(2)获取近乎完整的微生物基因组草图

通过持续富集特定微生物的序列片段，即使在低起始丰度下，也有望拼接出该微生物更完整的MAG。

复杂基因组与困难区域的深度解析

(1) 重复序列与结构变异研究

▪ 靶向富集高度重复区域（如着丝粒、端粒、转座子密集区、大片段串联重复），利用长读长优势精确解析其结构、拷贝数变异和序列组成，研究其在基因组进化、稳定性和功能中的作用。

▪ 富集特定基因簇（如次生代谢产物合成基因簇、抗病基因簇）及其侧翼区域，分析不同个体或物种间由于SV导致的基因簇结构差异。

(2) 高GC/高AT区域的攻克

专门富集传统PCR或杂交捕获难以覆盖的极端GC含量区域，研究其基因含量、调控元件和可能的特殊功能。

(3) 多倍体/杂合性研究

在植物或某些无脊椎动物中，靶向富集特定基因或区域，结合长读长的单分子分辨率，更准确地分析等位基因特异性表达、单倍型定相和基因剂量效应。

表观遗传学与修饰碱基的直接研究

(1) 靶向区域的直接表观遗传分析

在富集特定基因组区域（如启动子、增强子、印记控制区、重复元件）的同时，无需额外实验步骤，直接利用纳米孔测序的原生特性检测该区域上的碱基修饰（如5mC, 5hmC, 6mA等）。这使得研究：

▪ 特定基因或调控元件在特定条件（如发育、胁迫、疾病模型）下的动态修饰变化成为可能。

▪ 重复序列（如LINE-1）的修饰状态及其对基因组稳定性和转录活性的影响。

▪ 新发现的或罕见的碱基修饰在特定基因组位点的存在与功能。

病原体发现与进化研究

(1) 未知病原体筛查

在疑似存在未知病原体的样本（如患病动物组织、异常环境样本）中，使用“宿主去除”模式剔除宿主背景DNA，富集所有非宿主序列，提高发现新病毒、新细菌或古菌的机会。

(2)病原体基因组进化追踪

▪ 靶向富集特定病原体（如流感病毒、SARS-CoV-2）的关键基因（如血凝素HA、刺突蛋白S基因）或全基因组，监测其在宿主群体或环境中的突变积累、重组事件和选择压力。长读长对于精确追踪重组至关重要。

▪ 研究病原体在宿主内微进化过程中的基因组变异和异质性。

古DNA与降解样本分析

(1) 珍贵样本的靶向利用

古DNA或法医/考古降解DNA样本通常极其珍贵且高度碎片化/存在损伤。

(2) 高效富集样本中残存的、属于特定物种或特定基因（如线粒体基因组、性别决定基因、物种特异性标记）的片段，最大化利用有限材料获取关键信息。有助于物种鉴定、谱系关系重建和古病原体分析。

合成生物学与工程菌株验证

(1)大型合成结构的高效验证

在构建人工染色体、代谢通路或基因组编辑后，适应性采样可靶向富集插入/编辑的关键区域或连接处，快速、经济地验证构建体的完整性和准确性，无需对整个改造后的庞大基因组进行测序。