ChIP-seq技术介绍

染色质免疫沉淀测序(ChIP-sequencing,简称为ChIP-seq)是一种用于分析蛋白质与DNA交互作用的研究方法。该技术将染色质 免疫沉淀(ChIP)与大规模并行DNA测序结合起来以鉴定DNA与相关蛋白结合的部位,可用于精确定位任意感兴趣的蛋白在全基因组上的结合位点。在此之 前,ChIP-on-chip是研究这些蛋白与DNA联系的最常用的技术。

ChIP-seq通常主要用来确定转录因子和其他染色质相关蛋白 是如何来影响表型的作用机制。确定蛋白是如何与DNA互作从而调节基因表达对完全理解许多生物学过程和疾病状态来说是必不可少的。这一表观学信息是对表型 和表达分析的补充。目前,ChIP-seq技术被视作ChIP-chip(需要杂交芯片)最主要的替代方法。由于一个芯片仅局限于固定数目的探针,因此 ChIP-chip技术必然的会引入一些偏差。相比之下,测序则被认为是有着更小的偏向性,尽管不同测序技术的测序偏向性没有完全被理解。

与 转录因子和其他蛋白发生直接物理相互作用的特定DNA位点可以被染色质免疫沉淀所分离。ChIP技术可以产生活体中一个感兴趣的蛋白绑定的靶标DNA位点 的文库。大规模并行序列分析连同全基因组序列数据库被用来分析任意蛋白与DNA的互作模式或任意表观染色质修饰的模式(Johnson et al., 2007)。 这可以应用于一组可用于染色质免疫沉淀的蛋白质和染色质修饰,例如转录因子、聚合酶和转录复合物、结构蛋白、蛋白质修饰和DNA修饰 (http://res.illumina.com/documents/products/datasheets /datasheet_chip_sequence.pdf)。作为依赖特异性抗体的一个选择方案,已先后开发不同的方法来寻找基因组中所有核小体缺乏的 或核小体中断的活性调节区,如DNase-Seq和DNase-Seq技术。

染色质免疫沉淀测序技术的灵敏度取决于测序的深度(如匹配到基 因组上的序列数)、基因组的大小和目标因子的分布。测序深度与费用直接相关,如果在大的基因组中有大量的绑定序列要测序,那么花费会和所需要测序的序列数 目相一致。与之相比,ChIP-chip的花费则与敏感度不相关。

不像基于芯片的ChIP技术,ChIP-seq阵列的精度不受预定探针间 距的限制,它通过整合大量短的序列片段来获得高精度的结合位点定位信息。与ChIP-chip相比,ChIP-seq的数据能用来在实际蛋白结合位点的十 几个碱基内确定结合位点。结合位点的标记密度是蛋白-DNA结合亲和力的一个不错的指标(Jothi et al., 2008),它能轻松地定量比较一个蛋白结合不同DNA位点的亲和力(Bernstein et al., 2005)。

ChIP-seq实验流程
ChIP-seq实验流程
ChIP-seq结果展示
参考文献

Bernstein, B.E., Kamal, M., Lindblad-Toh, K., Bekiranov, S., Bailey, D.K., Huebert, D.J., McMahon, S., Karlsson, E.K., Kulbokas, E.J., 3rd, Gingeras, T.R., et al. (2005). Genomic maps and comparative analysis of histone modifications in human and mouse. Cell 120, 169-181.

Blow, M.J., McCulley, D.J., Li, Z., Zhang, T., Akiyama, J.A., Holt, A., Plajzer-Frick, I., Shoukry, M., Wright, C., Chen, F., et al. (2010). ChIP-Seq identification of weakly conserved heart enhancers. Nature genetics 42, 806-810.

Johnson, D.S., Mortazavi, A., Myers, R.M., and Wold, B. (2007). Genome-Wide Mapping of in Vivo Protein-DNA Interactions. Science 316, 1497-1502.

Jothi, R., Cuddapah, S., Barski, A., Cui, K., and Zhao, K. (2008). Genome-wide identification of in vivo protein-DNA binding sites from ChIP-Seq data. Nucleic acids research 36, 5221-5231.

Niu, W., Lu, Z.J., Zhong, M., Sarov, M., Murray, J.I., Brdlik, C.M., Janette, J., Chen, C., Alves, P., Preston, E., et al. (2011). Diverse transcription factor binding features revealed by genome-wide ChIP-seq in C. elegans. Genome research 21, 245-254.

Robertson, G., Hirst, M., Bainbridge, M., Bilenky, M., Zhao, Y., Zeng, T., Euskirchen, G., Bernier, B., Varhol, R., Delaney, A., et al. (2007). Genome-wide profiles of STAT1 DNA association using chromatin immunoprecipitation and massively parallel sequencing. Nature methods 4, 651-657.

Schmid, C.D., and Bucher, P. (2007). ChIP-Seq data reveal nucleosome architecture of human promoters. Cell 131, 831-832; author reply 832-833.

BS-seq技术介绍

亚硫酸盐测序(Bisulfite sequencing,简称为BS-seq)是一种利用亚硫酸盐处理DNA来测定其甲基化模式的方法(Chatterjee et al., 2012)。DNA甲基化是最初被发现的表观遗传标记,直到现在仍是研究最多的表观遗传标记。在动物中,DNA甲基化主要包括CpG岛的胞嘧啶(C)的C-5位置的甲基化,然后导致转录活性的抑制。

其原理在于,亚硫酸盐可使DNA上的胞嘧啶(C)转变成为尿嘧啶(U),同时已受甲基化的5-甲基胞嘧啶则不受影响。如此一来,通过亚硫酸盐处理可以使实验者得知DNA序列上的特定改变从而确定其甲基化的情形。许多类似分析可以通过修改序列来获得这类信息,这类分析的目标在于区分由亚硫酸盐处理导致的单核苷酸多态性(胞嘧啶和胸腺嘧啶)。

亚硫酸测序的优点使其能够应用于基因组尺度的分析,然而在此之前,总体测量DNA甲基化仅能通过其他技术手段实现,如限制性标记基因组扫描。在人类基因组计划完成后,许多科学家随后绘制出了人类表观组图谱(Bradbury, 2003; Esteller, 2006)。这一表观遗传信息的获得将对遗传序列执行和调控功能的理解十分重要。表观组比基因组相对不稳定,因此表观组被认为在基因-环境互作中起重要作用(Jones and Martienssen, 2005)

BS-seq实验流程
BS-seq分析流程
BS-seq结果展示

该结果是把每个染色体平均分成300等份,计算落在每一等份中平均的甲基化水平。

其中-5到0是基因的上游5000bp;0到10是基因区域,是把基因平均分为100等份,计算落在每一等份中平均的甲基化水平;10-15是基因下游5000bp。

对CG、CHG和CHH中甲基化C附近9 bp的序列特征进行分析。

图形上面是基因的信息,红色表示正向链上的基因,蓝色表示反向链上的基因,红色表示的峰是甲基化的Cytosine位点,高度代表甲基化reads的个数。两个轴分别代表该样品CHG甲基化和CpG甲基化情况。

参考文献

Bradbury, J. (2003). Human epigenome project–up and running. PLoS biology 1, E82.

Chatterjee, A., Stockwell, P.A., Rodger, E.J., and Morison, I.M. (2012). Comparison of alignment software for genome-wide bisulphite sequence data. Nucleic acids research 40, e79.

Esteller, M. (2006). The necessity of a human epigenome project. Carcinogenesis 27, 1121-1125.

Jones, P.A., and Martienssen, R. (2005). A blueprint for a Human Epigenome Project: the AACR Human Epigenome Workshop. Cancer research 65, 11241-11246.