靶向测序的必要性
靶向测序则能精准聚焦目标区域,以更快、更高效的工作流程获得所需区域的高深度覆盖数据。
传统靶向测序方法的局限
常用方法包括:
1. 靶向 PCR (扩增子测序): 流程相对简单经济。但 PCR 本身存在缺陷:难以扩增 GC 富含区或重复序列;读长受聚合酶限制;引入扩增偏差;破坏天然的表观遗传修饰。若结合短读长测序技术,则更难以分析结构变异 (SV) 等大片段区域。
2. 杂交捕获: 适用于大区域富集,但同样需要 PCR 步骤,流程复杂冗长。
3. 去除技术 (如宿主 DNA 去除): 需要额外步骤去除不需要的 DNA。
这些方法都涉及额外的湿实验操作,增加了时间和复杂性。
适应性采样:突破性的实时靶向方法
✔ 保留长读长与原始 DNA: 能够分析以往难以测序的区域,如复杂 SV、长重复序列、GC 富含区,并直接检测基因组变异和原始碱基修饰。
✔ 工作流程快速简单: 无需 PCR、探针或额外湿实验步骤。
✔ 高度灵活: 只需编辑一个包含目标坐标的 BED 文件即可快速更新靶标,无需复杂的面板优化。
工作原理:智能选择,实时决策
1.用户通过 BED 文件定义需要富集或去除的基因组区域及其参考序列。
2.DNA 分子开始通过纳米孔时,其起始部分序列会实时生成。
3.软件立即将此起始序列与目标列表进行比对:
• 若匹配富集目标,或不在去除名单内 → 继续完整测序该分子。
• 若不匹配富集目标,或属于去除区域 → 软件指令迅速排出该 DNA 分子,让位给下一条分子。
4.此过程显著提高了目标区域的覆盖深度(通常单张 MinION 芯片可富集 5-10 倍,达到 20-40x 平均覆盖深度,可靶向约 10% 的人类基因组)。
应用前景广阔
在复杂环境样本(如土壤、水体、共生体)中,99%以上的微生物可能是未知或难以培养的。适应性采样可以:
▪ “剔除”优势物种: 实时去除已知或高丰度微生物(如去除样本中大量存在的变形菌门序列),迫使设备优先测序稀有的、未被充分研究的微生物基因组片段。
▪ 富集特定功能基因/通路: 靶向富集参与关键生物地球化学循环的基因(如固氮基因nifH、氨氧化基因amoA、抗生素抗性基因等),研究其在群落中的分布、多样性和进化。
(2)获取近乎完整的微生物基因组草图
通过持续富集特定微生物的序列片段,即使在低起始丰度下,也有望拼接出该微生物更完整的MAG。
▪ 靶向富集高度重复区域(如着丝粒、端粒、转座子密集区、大片段串联重复),利用长读长优势精确解析其结构、拷贝数变异和序列组成,研究其在基因组进化、稳定性和功能中的作用。
▪ 富集特定基因簇(如次生代谢产物合成基因簇、抗病基因簇)及其侧翼区域,分析不同个体或物种间由于SV导致的基因簇结构差异。
(2) 高GC/高AT区域的攻克
专门富集传统PCR或杂交捕获难以覆盖的极端GC含量区域,研究其基因含量、调控元件和可能的特殊功能。
(3) 多倍体/杂合性研究
在植物或某些无脊椎动物中,靶向富集特定基因或区域,结合长读长的单分子分辨率,更准确地分析等位基因特异性表达、单倍型定相和基因剂量效应。
在富集特定基因组区域(如启动子、增强子、印记控制区、重复元件)的同时,无需额外实验步骤,直接利用纳米孔测序的原生特性检测该区域上的碱基修饰(如5mC, 5hmC, 6mA等)。这使得研究:
▪ 特定基因或调控元件在特定条件(如发育、胁迫、疾病模型)下的动态修饰变化成为可能。
▪ 重复序列(如LINE-1)的修饰状态及其对基因组稳定性和转录活性的影响。
▪ 新发现的或罕见的碱基修饰在特定基因组位点的存在与功能。
在疑似存在未知病原体的样本(如患病动物组织、异常环境样本)中,使用“宿主去除”模式剔除宿主背景DNA,富集所有非宿主序列,提高发现新病毒、新细菌或古菌的机会。
(2)病原体基因组进化追踪
▪ 靶向富集特定病原体(如流感病毒、SARS-CoV-2)的关键基因(如血凝素HA、刺突蛋白S基因)或全基因组,监测其在宿主群体或环境中的突变积累、重组事件和选择压力。长读长对于精确追踪重组至关重要。
▪ 研究病原体在宿主内微进化过程中的基因组变异和异质性。
古DNA或法医/考古降解DNA样本通常极其珍贵且高度碎片化/存在损伤。
(2) 高效富集样本中残存的、属于特定物种或特定基因(如线粒体基因组、性别决定基因、物种特异性标记)的片段,最大化利用有限材料获取关键信息。有助于物种鉴定、谱系关系重建和古病原体分析。
在构建人工染色体、代谢通路或基因组编辑后,适应性采样可靶向富集插入/编辑的关键区域或连接处,快速、经济地验证构建体的完整性和准确性,无需对整个改造后的庞大基因组进行测序。
