在临床研究、病原体监测和物种鉴定等领域,研究人员常常只需要分析基因组中的特定部分,而非整个基因组。靶向测序技术应运而生,它能够选择性地对目标区域进行测序富集或剔除非目标区域,大幅提升分析效率。Oxford Nanopore Technologies (ONT) 开发了一项名为“适应性采样”(Adaptive Sampling) 的独特技术,无需特殊文库制备即可实现这一目标。

 

靶向测序的必要性

 
对整个样本进行测序(全基因组测序,WGS)虽然全面,但存在局限:当目标区域仅占基因组一小部分,或需要从复杂微生物群落中获取特定微生物信息时,WGS 可能无法为目标区域提供足够的覆盖深度。额外的测序不仅增加成本和时间,也加剧了数据管理的复杂性。

靶向测序则能精准聚焦目标区域,以更快更高效的工作流程获得所需区域的高深度覆盖数据

 

传统靶向测序方法的局限

 
传统方法依赖文库制备阶段进行目标富集。

常用方法包括:

1. 靶向 PCR (扩增子测序): 流程相对简单经济。但 PCR 本身存在缺陷:难以扩增 GC 富含区或重复序列;读长受聚合酶限制;引入扩增偏差;破坏天然的表观遗传修饰。若结合短读长测序技术,则更难以分析结构变异 (SV) 等大片段区域。

2. 杂交捕获: 适用于大区域富集,但同样需要 PCR 步骤,流程复杂冗长。

3. 去除技术 (如宿主 DNA 去除): 需要额外步骤去除不需要的 DNA。

这些方法都涉及额外的湿实验操作,增加了时间和复杂性。

 

适应性采样:突破性的实时靶向方法

 
适应性采样彻底改变了靶向测序模式,将富集或去除过程完全集成到实时测序环节中。这种基于软件的方法具有显著优势:

✔ 留长读长与原始 DNA: 能够分析以往难以测序的区域,如复杂 SV、长重复序列、GC 富含区,并直接检测基因组变异和原始碱基修饰。

✔ 工作流程快速简单: 无需 PCR、探针或额外湿实验步骤。

✔ 高度灵活: 只需编辑一个包含目标坐标的 BED 文件即可快速更新靶标,无需复杂的面板优化。

 

工作原理:智能选择,实时决策

 
适应性采样利用了 ONT 实时测序和碱基识别的特点:

1.用户通过 BED 文件定义需要富集或去除的基因组区域及其参考序列。

2.DNA 分子开始通过纳米孔时,其起始部分序列会实时生成。

3.软件立即将此起始序列与目标列表进行比对:

• 若匹配富集目标,或不在去除名单内 → 继续完整测序该分子。

 若不匹配富集目标,或属于去除区域 → 软件指令迅速排出该 DNA 分子,让位给下一条分子。

4.此过程显著提高了目标区域的覆盖深度(通常单张 MinION 芯片可富集 5-10 倍,达到 20-40x 平均覆盖深度,可靶向约 10% 的人类基因组)。

 

应用前景广阔

 
宏基因组学与环境微生物组研究
 
(1) 稀有/低丰度微生物的靶向富集

在复杂环境样本(如土壤、水体、共生体)中,99%以上的微生物可能是未知或难以培养的。适应性采样可以:

▪ “剔除”优势物种: 实时去除已知或高丰度微生物(如去除样本中大量存在的变形菌门序列),迫使设备优先测序稀有的、未被充分研究的微生物基因组片段。

▪ 富集特定功能基因/通路: 靶向富集参与关键生物地球化学循环的基因(如固氮基因nifH、氨氧化基因amoA、抗生素抗性基因等),研究其在群落中的分布、多样性和进化。

(2)获取近乎完整的微生物基因组草图

通过持续富集特定微生物的序列片段,即使在低起始丰度下,也有望拼接出该微生物更完整的MAG。

 
复杂基因组与困难区域的深度解析
 
(1) 重复序列与结构变异研究

▪ 靶向富集高度重复区域(如着丝粒、端粒、转座子密集区、大片段串联重复),利用长读长优势精确解析其结构、拷贝数变异和序列组成,研究其在基因组进化、稳定性和功能中的作用。

▪ 富集特定基因簇(如次生代谢产物合成基因簇、抗病基因簇)及其侧翼区域,分析不同个体或物种间由于SV导致的基因簇结构差异。

(2) 高GC/高AT区域的攻克

专门富集传统PCR或杂交捕获难以覆盖的极端GC含量区域,研究其基因含量、调控元件和可能的特殊功能。

(3) 多倍体/杂合性研究

在植物或某些无脊椎动物中,靶向富集特定基因或区域,结合长读长的单分子分辨率,更准确地分析等位基因特异性表达、单倍型定相和基因剂量效应。

 
表观遗传学与修饰碱基的直接研究
 
(1) 靶向区域的直接表观遗传分析

在富集特定基因组区域(如启动子、增强子、印记控制区、重复元件)的同时,无需额外实验步骤,直接利用纳米孔测序的原生特性检测该区域上的碱基修饰(如5mC, 5hmC, 6mA等)。这使得研究:

▪ 特定基因或调控元件在特定条件(如发育、胁迫、疾病模型)下的动态修饰变化成为可能。

▪ 重复序列(如LINE-1)的修饰状态及其对基因组稳定性和转录活性的影响。

▪ 新发现的或罕见的碱基修饰在特定基因组位点的存在与功能。

 
病原体发现与进化研究
 
(1) 未知病原体筛查

在疑似存在未知病原体的样本(如患病动物组织、异常环境样本)中,使用“宿主去除”模式剔除宿主背景DNA,富集所有非宿主序列,提高发现新病毒、新细菌或古菌的机会。

(2)病原体基因组进化追踪

▪ 靶向富集特定病原体(如流感病毒、SARS-CoV-2)的关键基因(如血凝素HA、刺突蛋白S基因)或全基因组,监测其在宿主群体或环境中的突变积累、重组事件和选择压力。长读长对于精确追踪重组至关重要。

▪ 研究病原体在宿主内微进化过程中的基因组变异和异质性。

 
古DNA与降解样本分析
 
(1) 珍贵样本的靶向利用

古DNA或法医/考古降解DNA样本通常极其珍贵且高度碎片化/存在损伤。

(2) 高效富集样本中残存的、属于特定物种或特定基因(如线粒体基因组、性别决定基因、物种特异性标记)的片段,最大化利用有限材料获取关键信息。有助于物种鉴定、谱系关系重建和古病原体分析。

 
合成生物学与工程菌株验证
 
(1)大型合成结构的高效验证

在构建人工染色体、代谢通路或基因组编辑后,适应性采样可靶向富集插入/编辑的关键区域或连接处,快速、经济地验证构建体的完整性和准确性,无需对整个改造后的庞大基因组进行测序。